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Promoteur s'exprimant specifiquement 
dans ies cellules de racines de plantes, vecteurs 
et cellules botes recombinantes comprenant un tel 
promoteur et plantes transgeniques obtenues 

5 

La presente invention concerne un nouveau promoteur vegetal 
capable de dinger I'expression d'une sequence nucleotidique d'interet 
dans Ies cellules de la racine d'une plante, ainsi que des vecteurs 
recombinants contenant un tel promoteur, de preference associee a une 
10 sequence nucleotidique dont I'expression est recherchee dans Ies 
cellules constitutives des racines de plantes. 

Dans Ies annees recentes, Ies applications industrielles 
rendues possibles par Ies transformations des plantes a I'aide du genie 
genetique ont ete croissantes. 
15 De nombreux genes d'origine procarycte ou eucaryote 

(d'animaux ou de plantes), codant specifiquement pour des proteines 
conferant de nouvelles proprietes agronomiques, ont ete isoles et 
transferes chez Ies plantes par genie genetique. 

Dans un grand nombre de cas, Ies genes qui ont ete introduits 
20 dans des plantes constituent des sequences chimeres, associant des 
elements regulateurs d'origines differentes. 

Ainsi, le gene codant pour une proteine d'interet est souvent 
place sous le controle d'un promoteur constitutif fort permettant a iadite 
proteine d'etre exprimee dans la totalite de la plante. 
25 A titre d'exemple, le promoteur du transcrit 35S du virus de la 

mosaique du chou-fleur (35S CaMV) a ete largement utilise dans des 
constructions de genes chimeres pour I'expression de proteines d'interet 
chez Ies plantes. 

Desormais, pour un grand nombre d'applications, il n'est pas 
30 necessaire que la proteine d'interet conferant la propriete agronomique 
recherchee presente une expression distribute dans la totalite des 
organes et/ou des types cellulaires de la plante transformee. 

Tres precocement, la recherche d'une expression plus 
specifique du gene d'interet a ete entreprise et a conduit, par exemple, a 
35 Tidentification de promoteurs specifiques de tissus ou d'organes. 
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En particulier, un promoteur dirigeant I'expression d'un 
polynucleotide d'interet de fa?on a la fois forte et ciblee dans la racine 
permettrait de nombreuses applications que Ton peut classer comme 
suit : 

5 (i) defense contre les pathogenes a point d'entree racinaire, 

telles que des bacteries, des champignons, des;. nematodes ou des 
insectes. 

(ii) resistance au stress (froid, stress hydrique, stress salin); 

(iii) amelioration de la qualite (exemple: augmenter la teneur en 
10 saccharose dans la betterave a sucre); 

(iv) nutrition (exemple: exprimer un gene de transporteur des 

nitrates). 

Comme deja indique plus haut, ies promoteurs decrits dans 
I'etat de la technique ne permettent pas I'expression d'un polynucleotide 

15 d'interet dans I'ensemble des couches celiulaires de la racine y compris 
toutes les assises. 

Par exemple, le gene arskl d'A thaliana (Hwang et a/., 1995) 
est exprime specifiquement dans la racine, mais son expression est 
limitee aux couches externes de la racine (epiderme, endoderme, cortex) 

20 c'est-a-dire les cellules impliquees dans Tabsorption d'eau. L'expression 
est tres faible dans le systeme vasculaire. Le profil d'expression de ce 
gene evoque un role dans le stress hydrique. De fait, I'expression de ce 
gene est inductible par un stress hydrique (exposition des racines a fair, 
ou traitement des racines par I'ABA ou NaCI), et diminue fortement 

25 lorsque les racines sont rehydratees. 

Un autre exemple illustratif est le mutant scarecrow d'A 
thaliana (Malamy et aL 1 997) qui est affecte dans Torganisation radiale 
de la racine: les couches de I'endoderme et du cortex ne s'individualisent 
pas et restent fusionnees en une couche mutante possedant des 

so caracteristiques de I'endoderme et du cortex. Le gene scarecrow affecte 
par la mutation est exprime dans I'endoderme, les cellules initiales de 
I'endoderme, et parfois dans le centre quiescent de la racine. 

De plus, les promoteurs decrits dans Tetat de la technique, 
d'une part, ne permettent pas un haut niveau d'expression du 
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polynucleotide d'interet, et d'autre part, ne sont pas actifs tout au long du 
deveioppernent de la plante. 

Le besoin d'un promoteur vegetal fort, specifique des racines, 
et actif quel que soit le stade de deveioppernent de la plante, est 
5 desormais comble selon la presente invention. 

La demanderesse a ainsi isole, a partir du genome vegetal 
d'Arabidopsis thaliana, un nouveau promoteur capable de diriger 
('expression d'un polynucleotide d'interet specifiquement dans les 
racines d'une plante, ledit promoteur assurant un haut niveau 
10 depression du polynucleotide d'interet a la fois dans I'epiderme, le 
cortex, le vaisseau ou 1'endoderme ainsi que dans toutes les assises de 
la racine, ceci durant tous les stades de deveioppernent de la plante. 

Ainsi, la presente invention est relative a un acide nucleique 
isole caracterise en ce qu'il comprend un polynucleotide codant pour un 
15 promoteur vegetal capable de diriger I'expression d'une sequence 
nucleotidique d'interet dans les cellules de la racine d'une plante, durant 
la totalite du deveioppernent de cette derniere, ou un acide nucleique de 
sequence complementaire. 

De preference, un acide nucleique selon Tinvention se presente 
20 sous une forme isolee ou purifiee. 

Le terme « isole » au sens de la presente invention designe un 
materiel biologique qui a ete soustrait a son environnement originel 
(I'environnement dans lequel il est localise naturellement). Par exemple, 
un polynucleotide present a I'etat naturel dans une plante ou un animal 
25 n'est pas isole. Le meme polynucleotide separe des acides nucieiques 
adjacents au sein desquels il est naturellement insere dans le genome 
de la plante ou I'animal est isole. 

Un tel polynucleotide peut etre inclus dans un vecteur et/ou un 
tel polynucleotide peut etre inclus dans une composition et demeurer 
30 neanmoins a I'etat isole du fait que le vecteur ou la composition ne 
constitue pas son environnement naturel. 

Le terme « purifie » ne necessite pas que le materiel soit 
present sous une forme de purete absolue, exclusive de la presence 
d'autres composes. II s'agit plutot d'une definition relative. 
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Un polynucleotide est a I'etat purifie apres purification du 
materiel de depart ou du materiel naturel d'au moins un ordre de 
grandeur, de preference 2 ou 3 et preferentiellement 4 ou 5 ordres de 
grandeur. 

5 Aux fins de ia presente description, 1'expression « sequence 

nucleotidique » peut etre employee pour designer indifferemment un 
polynucleotide ou un acide nucleique. L'expression « sequence 
nucleotidique » englobe le materiel genetique lui-meme et n'est done pas 
restreinte a reformation concernant sa sequence. 

10 L'invention concerne egalement un acide nucleique caracterise 

en ce qu'il cornprend tout ou partie d'un polynucleotide possedant au 
moins 80% d'identite en nucleotides avec la sequence nucleotidique 
SEQ ID N°1, ou un acide nucleique de sequence complementaire. 

Le « pourcentage d'identite de nucleotides » entre deux 

15 sequences, au sens de la presente invention, peut etre determine en 
comparant deux sequences alignees de maniere optimale, a travers une 
fenetre de comparaison. La partie de la sequence nucleotidique dans la 
fenetre de comparaison peut ainsi comprendre des additions ou des 
deletions (par exemple des « gaps») par rapport a la sequence de 

20 reference (qui ne cornprend pas ces additions ou ces deletions) de 
maniere a obtenir un alignement optimal des deux sequences. 

Le pourcentage est calcule en determinant le nombre de 
positions auxquelles une base nucleique identique est observee pour les 
deux sequences comparees, puis en divisant le nombre de positions 

25 auxquelles il y a identite des deux bases par le nombre total de positions 
dans la fenetre de comparaison, puis en multipliant le resultat par 100 
afin d'obtenir le pourcentage d'identite de sequence. 

L'alignement optimal des sequences pour la comparaison peut 
etre realise de maniere informatique a I'aide d'algorithmes connus (par 

so exemple le logiciel FASTA de la Societe WISCONSIN GENETICS 
SOFTWARE PACKAGE, GENETICS COMPUTER GROUP (GCG), 575 
Science Doctor, Madison , Wis). 

A titre d'illustration, le pourcentage d'identite de sequence 
pourra etre effectue a I'aide du logiciel precite FASTA, en utilisant 

35 exclusivement les parametres par defaut. 
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Ainsi, ies differences nucleotidiquss que peut ccmprsr.dre un 
acide nucleique selon I'invention par rapport a la sequence nucleotidique 
SEQ ID N°1 peut resulter en des substitutions, deletions ou additions 
d'un ou plusieurs nucleotides consecutifs ou non. 
5 Font egalement partie de I'invention des acides nucieiques 

comprenant tout ou partie d'un polynucleotide possedant au moins 85%, 
90%, 95%, 98%, 99%, 99,5%, ou encore 99,8% d'identite en nucleotides 
avec la sequence nucleotidique SEQ ID N°1, ou un acide nucleique de 
sequence complementaire. 

io Selon un autre aspect, I'invention est egalement relative a un 

acide nucleique caracterise en ce qu'il comprend tout ou partie d'un 
polynucleotide hybridant, dans des conditions d'hybridation de forte 
stringence, avec ta sequence nucleotidique SEQ ID N°1, ou un acide 
nucleique de sequence complementaire. 

is Par « partie » d'un polynucleotide promoteur selon Pinvention, 

on entendra une sequence nucleotidique d'une longueur en bases 
inferieure a celle de la sequence SEQ ID N°1 et conservant la capacite a 
diriger I'expression d'une sequence nucleotidique d'interet dans Ies 
cellules de la racine d'une plante. 

20 L'activite biologique d'une partie d'un polynucleotide promoteur 

selon T invention peut etre aisement verifiee par I'homme du metier, 
notamment a Taide des constructions de vecteurs et des procedes de 
transformation de plantes avec ces derniers, tels que decrits dans Ies 
exemples. 

25 Par « partie » d'un promoteur selon ['invention, on entend 

notamment Ies sequences candidates suivantes: 

- le polynucleotide allant du nucleotide en position 1 jusqu'au 
nucleotide en position 2400 de la sequence SEQ ID N°3; 

- le polynucleotide allant du nucleotide en position 493 jusqu'au 
30 nucleotide en position 2400 de la sequence SEQ ID N°3; 

- le polynucleotide allant du nucleotide en position 1076 
jusqu'au nucleotide en position 2400 de la sequence SEQ ID N°3; 

- le polynucleotide allant du nucleotide en position 1976 
jusqu'au nucleotide en position 2400 de la sequence SEQ ID N°3; et 
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- le polynucleotide allant du nucleotide en position 2040 
jusqu'au nucleotide en position 2400 de la sequence SEQ ID N°3. 

A titre illustratif, une partie d'un polynucleotide promoteur selon 
I'invention peut etre obtenue par coupure enzymatique d'un acide 
5 nucleique tel que decrit ci-dessus, notamment un acide nucleique de 
sequence SEQ ID N°1, a I'aide d'endonucleases de restriction. 

Une « partie » d'un polynucleotide promoteur selon I'invention 
peut etre aussi obtenue par exemple par deletion d'un ou plusieurs 
nucleotides du polynucleotide de sequence SEQ ID N°1 a I'aide de la 
10 technique a Texonuclease III decrite dans les exemples. Un 
polynucleotide partie du promoteur vegetal selon I'invention a 
avantageusement une longueur en nucleotides allant de 200, 250, 300, 
400, 500, 750, 100, 1200, 1500 ou 2000 nucleotides (ou paire de bases 
s'il se presente sous la forme double brin). 
15 L'homme du metier peut a cet effet utiliser la carte de restriction 

de la sequence nucleotidique SEQ ID N°1, representee a la figure 1 . 

Pour la mise en oeuvre d'enzymes de restriction aux fins 
d'obtenir des fragments de polynucleotides correspondant a une partie 
d'un polynucleotide promoteur selon I'invention, Thomme du metier 
20 pourra avantageusement se referer a I'ouvrage de Sambrook et al. 
(1989, Molecular Cloning : A Laboratory Manual. 2 ed. Cold Spring 
Harbor Laboratory, Cold Spring Harbor, New York). 

Une partie d'un polynucleotide promoteur selon I'invention 
pourra egalement etre preparee par amplification specifique du fragment 
25 d'interet a I'aide d'un couple d'amorces encadrant, respectivement du 
cote 5' et du cote 3\ la sequence d'interet , par exemple a I'aide de la 
methode PCR, telle que decrite notamment dans les brevets americains 
N°US 4 683 195, US 4,683,202 et US 4 f 965,188. 

Par « conditions d'hybridation de forte stringence » au sens de 
30 la presente invention, on entendra les conditions d'hybridation suivantes: 

• prehybridation des filtres pendant 8 heures a 65°C dans un 
tampon compose de 6 x SSC, 50 mM Tris-HCI (pH 7.5), 1 mM EDTA, 
0,02% PVP, 0,02% Ficoll , 0,02% BSA, et 500 pg par ml d'ADN de 
35 sperme de saumon denature; 
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• hybridation des fiitres pendant 48 heures a 65°C en presence 
de tampon 1 x SSC correspondant a 0,15 M de NaCI et 0,05M de citrate 
de sodium; 

5 

• trois lavages des fiitres dans une solution contenant 2 x SSC 
et 0,1% SDS a 68°C pendant 15 minutes. 

Les conditions d'hybridation decrites plus haut sont adaptees a 

10 Thybridation, dans des conditions de forte stringence, d'une molecule 
d'acide nucleique d'une longueur de 20 nucleotides. 

II va sans dire que les conditions d'hybridation ci-dessus 
decrites doivent etre adaptees en fonction de la longueur de I'acide 
nucleique dont Thybridation est recherchee, selon des techniques bien 

15 connues de I'homme du metier. 

Les conditions convenables d'hybridation peuvent par exempie 
etre adaptees selon I'enseignement contenu dans I'ouvrage de Hames 
et Higgins (1985, Nucleic Acid Hybridization : A practical approach , 
Hames and Higgins Ed., IRL Press, Oxford), ou encore dans I'ouvrage 

20 de Sambrook etal. (1989) precite. 

L'invention concerne egalement un acide nucleique comprenant 
un polynucleotide promoteur tel que defini ci-avant, caracterise en ce 
qu'il comprend en outre une sequence nucleotidique d'interet 
fonctionnellement associee au promoteur vegetal et dont ('expression est 

25 recherchee dans les cellules de la racine d'une plante. 

Un acide nucleique repondant a une telle definition est par 
exempie I'acide nucleique de sequence nucleotidique SEQ ID N°2 
comprenant la sequence du gene gas place sous le controle du 
promoteur de sequence nucleotidique SEQ ID N°1. 

30 De maniere avantageuse, un tel acide nucleique comprendra 

une sequence nucleotidique d'interet choisie parmi les sequences 
codantes de gene interagissant avec des parasites ou des pathogenes 
tels que les nematodes ou les champignons, comme par exempie les 
sequences codantes de glucanase, ladite sequence nucleotidique 
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d'interet etant placee sous le controle d'un polynucleotide promoteur 
selon rinvention. 

II peut egalement s'agir de sequences d'endochitinases telles 
que celles decrites dans le brevet europeen n° EP 493,581 ou encore de 
5 sequences de genes agissant sur la teneur en sucre de la plante. 

A titre d'exemple, les sequences codantes de genes d'interet 
assurant la protection d'une plante contre d'autres conditions de stress 
pourront etre avantageusement placees sous le controle d'un 
polynucleotide promoteur selon I'invention. 
10 Stress hydrique ou salin: 

• gene arskl (Hwang, I. et at. ; 1995); 

• CDNA pA9 (Winicov, I. , Deutch S.E. 1994); 

• CDNA Alfin 1 (Bastola, DR et aL 1998). 

D'autres sequences codantes pourraient etre utilisees sous ie 

15 controle du promoteur selon 1'invention, pour agir sur la teneur eh 
saccharose de la betterave a sucre: gene BvSPSI (Hesse H. et a/., 
1995), ou surexprimer un gene deja exprime physiologiquement comme 
les genes de transporters de nitrate NRT-j ou NRT 2 ( Crawford, N.M. et 
aL ,1998; Leah R. et aL, 1991). 

20 [.'invention est en outre relative a des fragments nucleotidiques 

comprenant 10 a 2000 nucleotides consecutifs d'un acide nucleique 
selon i'invention, en particulier d'un acide nucleique possedant au moins 
80% d'identite en nucleotide avec la sequence SEQ ID N°1 ou encore un 
acide nucleique hybridant, dans des conditions d'hybridation de forte 

25 stringence, avec la sequence nucleotidique SEQ ID N°1, ou d'un acide 
nucleique de sequence complementaire. 

De preference, de tels fragments auront une longueur de 10, 
12, 15, 18 ou 20 a 25, 35, 40, 50, 70, 80, 100, 200, 500, 1000, 1500 ou 
2000 nucleotides consecutifs d'un polynucleotide promoteur selon 

30 ('invention ou consistant en des fragments d'une longueur de 12, 15, 18, 
20, 25, 35, 40, 50, 70, 80, 100, 200, 500, 1000, 1500 ou 2000 
nucleotides consecutifs d'un polynucleotide promoteur selon 1'invention. 

De tels fragments nucleotidiques pourront avantageusement 
etre mis en oeuvre en tant que sondes ou amorces nucleotidiques aux 

35 fins de detection ou d'amplification de la totalite ou d'une partie d'une 
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sequence a activite promoteur specifique des racines de plantes selon 
rinvention. 

Selon encore un autre aspect, 1'invention concerne un vecteur 
recombinant de clonage et/ou d'expression comprenant un 
5 polynucleotide promoteur selon I'invention. Un tel vecteur recombinant 
comprendra avantageusement une sequence nucleotidique d'interet 
placee sous le controle dudit promoteur vegetal. 

Des vecteurs pouvant etre utilises aux fins de la presente 
invention sont notamment les suivants: 

10 

• vecteur pB!N19 (Bevan et a/., 1984, Nucleic Acids Research, 
vol. 12: 8711-8721, commercialise par la Societe CLONTECH , Palo 
Alto, Californie, USA); 

15 • vecteur 101 (Jefferson , 1987, Plant Molecular Biology 

Reporter, vol.5: 387-405, commercialise par la Societe CLONTECH); 

• vecteur pBI221 (Jefferson, 1987, Plant Molecular Biology 
Reporter, vol.5: 387-405, commercialise par la Societe CLONTECH); 

20 

• .vecteur pBI121 (Jefferson, 1987, Plant Molecular Biology 
Reporter, vol.5: 387-405, commercialise par la Societe CLONTECH). 

• vecteur pEGFP (Cormack, B.P. et a/. 1996; Yang T.T. et at., 
1996), commercialise par la Societe Clontech. 

25 • vecteur pC-gus represents a la figure 10. 

Un vecteur recombinant prefere selon rinvention est par 
exemple le vecteur recombinant contenu dans la souche d'E. Coli 
deposee a la Collection Nationale de Culture de Micro-Organismes 
30 (CNCM) le 25 Mai 1999 sous le n° d'acces 1-2218. 

L'invention a en outre pour objet une cellule hote recombinante, 
caracterisee en ce qu'elle comprend un acide nucleique a activite de 
promoteur vegetal specifique des racines de plantes selon rinvention, 
eventuellement associee a un polynucleotide d'interet place sous le 
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controle de ce dernier, ou un vecteur recombinant tel que defini ci- 
dessus. 

Les cellules hotes recombinantes preferees selon Tinvention 
peuvent etre indifferemment d'origine bacterienne ou vegetale. 
5 Ainsi, peuvent notamment etre utilisees des cellules 

bacteriennes de differentes souches de E. coli ou encore 
d'Agrobactehum tumefaciens. 

II s'agit egalement de cellules de plantes transformees par un 
vecteur conforme a l'invention, tel que des cellules d'Arabidopsis 
10 thaliana, de colza, de tabac ou encore de maYs. 

Une cellule hote recombinante preferee selon I'invention est la 
cellule de la souche de E.coli deposee a la CNCM le 25 Mai 1999 sous 
le n°d'acces 1-2218. 

L'invention concerne aussi un organisme multicellulaire vegetal 
is recombinant caracterise en ce qu'il comprend des cellules hotes 
recombinantes telles que definies ci-dessus. 

L'invention concerne en particulier une plante transgenique 
comprenant, sous une forme integree dans son genome, un acide 
nucleique selon ('invention, en particulier un acide nucleique comprenant 
20 un polynucleotide promoteur conforme a I'invehtion et une sequence 
nucleotidique d'interet placee sous le controle de ce dernier. 

Une plante transgenique selon ('invention peut etre notamment 
un colza, un tabac, un mais ou encore Arabidopsis thaliana. 

Les plantes transgeniques telles que definies ci-dessus ont 
25 done la propriete d'exprimer une sequence nucleotidique d'interet 
specifiquement au niveau des differents types cellulaires de la racine ( 
de I'exterieur vers i'interieur: epiderme, cortex, endoderme, pericycle, 
vaisseau ), a tous les stades de developpement de la plante. 

L'invention a en outre pour objet un procede d'obtention d'une 
30 plante transgenique exprimant specifiquement une sequence 
nucleotidique d'interet dans les cellules de la racine a tous les stades de 
developpement de ladite plante, caracterise en ce qu'il comprend les 
etapes suivantes: 

a) obtention d'une cellule hote recombinante vegetale conforme 
35 a Tinvention; 
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b) reaeneration d'une plante entiere a partir de la cellule bote 
recombinante obtenue a I'etape a); 

c) selection des plantes obtenues a I'etape b) ayant integre la 
sequence nucleotidique d'interet placee sous le controle du 

5 polynucleotide promoteur vegetal selon 1'invention. 

L'invention est egalement relative a un procede d'obtention 
d'une plante transgenique caracterise en ce qu'il comprend les etapes 
suivantes: 

10 a) obtention d'une cellule hote recombinante d'Agrobacterium 

tumefaciens contenant une sequence nucleotidique d'interet placee sous 
te controle du polynucleotide promoteur vegetal selon 1'invention; 

b) transformation de la plante d'interet par infection avec la 
cellule hote recombinante ti'Agrobacterium tumefaciens obtenue a 

15 I'etape a); 

c) selection des plantes ayant integre la sequence nucleotidique 
d'interet placee sous le controle du polynucleotide promoteur vegetal 
selon l'invention. 

20 L'invention a en outre pour objet un procede d'obtention d'une 

plante transgenique caracterise en ce qu'il comporte les etapes 
suivantes: 

a) transfection d'une cellule de plante avec un acide nucleique 
ou un vecteur recombinant comprenant une sequence nucleotidique 

25 d'interet placee sous le controle du polynucleotide promoteur selon 
Tinvention; 

b) regeneration d'une plante entiere a partir de cellules de 
plante recombinantes obtenues a I'etape a) ; 

c) selection des plantes ayant integre la sequence nucleotidique 
30 d'interet placee sous le controle du polynucleotide promoteur vegetal 

selon Tinvention. 

L'un quelconque des procedes d'obtention d'une plante 
transgenique ci-dessus decrit peut en outre comporter les etapes 
35 additionnelles suivantes: 
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d) croisement entre elles de deux plantes transgeniques telies 
qu'obtenues a I'etape c); 

e) selection des plantes homozygotes pour le transgene. 

5 Seion une autre alternative, Tun quelconque des precedes ci- 

dessus decrits pourra en outre comprendre ies etapes suivantes: 

d) croisement d'une plante transgenique obtenue a I'etape c) de 
Tun quelconque de ces procedes avec une plante de la meme espece; 
io e) selection des plantes issues du croisement de I'etape d) 

ayant conserve le transgene. 

Uinvention a en outre pour objet une plante transgenique telle 
qu'obtenue selon Tun quelconque des procedes ci-dessus. 
15 De maniere preferee, une plante transgenique selon ('invention 

a non seuiement integre dans son genome un transgene comprenant 
une sequence nucleotidique d'interet placee sous le controle du 
polynucleotide promoteur vegetal presentement decrit mais exprime 
ladite sequence nucleotidique d'interet majoritairement ou exclusivement 
20 dans Ies cellules constitutives de la racine. 

Enfin, ('invention concerne aussi une semence de plante dont 
Ies cellules constitutives comprennent dans leur genome un acide 
nucleique selon I'invention. 

II s'agit notamment d'une semence de Arabidopsis thaiiana, de 
25 colza, de tabac ou de mais ayant incorpore un acide nucleique selon 
I'invention. 

L'invention sera en outre illustree, sans pour autant etre limitee, 
par Ies figures et Ies exemples suivants. 

30 La figure 1 represente une carte de restriction de la sequence 

nucleotidique SEQ ID N°1. 

Les motifs suivants ont ete identifies dans cette sequence: deux 
motifs TGACG correspondant au site de fixation du facteur Asfl 
specifique de la racine dans le promoteur 35 S du CaMV (position 1000- 
35 1004 et 1866-1870), deux motifs proches, a un nucleotide pres, de 
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seauences enhancer du meme promoteur 35S (position 28-35: 
CTGAAAG, au lieu de GTGAAAG et position 882-889; GTGCTTTG, au 
lieu de GTGGTTTG) et 3G-box ACGT (positions 285-288, 604-607, 
1107-1 1 10). Par ailleurs, cette sequence comporte 21 motifs TATA et 9 
5 motifs CAAT. 

L'importance fonctionnelie de ces motifs pourra etre evaluee 
par la methode a I'exonuclease III, selon Ausubel et ai (1989). Cette 
methode permet d'obtenir des fragments de promoteur de taille 
decroissante, qui seront clones en amont du gene gus dans un vecteur 
10 permettant la transformation d'Arabidopsis. 

La figure 2 iliustre la construction 1 ayant ete utilisee pour 
risolement du promoteur selon I'invention, en ^absence (figure 2a) ou en 
presence (fig.2b) de Tinsert. 
15 L'insert de 4.27 kb est clone a partir du vecteur de « kanamycin 

rescue » (figure 7) dans I'ADN-T du vecteur pBin19 par une double 
digestion EcoRI-Xbal. Cet insert comporte 2.14 kb de sequence 
genomique du clone Ir1 ( SEQ ID N°3 net 136-2284) et 2.13kb de I'ADN- 
T de pGKB5: sequence codante de gus et signal de polyadenylation nos 
20 (figure 8 - net 632-2762). 

. LB : bordure gauche de I'ADN-T de pBin19. 
LacZ: lacZ region du phage M13mp19. 

NPTH: fragment contenant le promoteur nos, le gene de 
resistance a la neomycine, et le site de polyadenylation nos. 
25 RB : bordure droite de I'ADN-T de pBin19. 

kan: fragment contenant l'origine de replication RK2 du 
plasmide pRK252 et le gene kan de resistance a la kanamycine de 
Streptococcus. 

30 La figure 3 iliustre ('expression GUS du transformant 

d'Arabidopsis (ecotype WS) au cours du developpement. 

a- 7 jours apres germination. 

b- 14 jours apres germination. 

c- 24 jours apres germination. 
35 d- detail d'une racine. 
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La figure 4 illustre une coupe transversaie de racine du 
transformant apres revelation de I'activite GUS. 

La figure 5 represente une autoradiographic d'un Northern blot 
5 hybride avec une sonde GUS. 

6 (jg d'ARN ont ete deposes dans chaque puits. 
Puits n°1-3-5: ARN de parties aeriennes du transformant 
homozygote n°1, n°13 et de plante non transformer WS, 
respectivement. 

io Puits n°2-4-6: ARN de racines des memes plantes. 

La figure 6 illustre I'analyse quantitative de Texpression GUS de 
transformants d'Arabidopsis obtenus avec la construction 1, au cours du 
developpement. Elle materialise la comparaison de I'activite GUS dans 
is les racines et la partie aerienne du transformant initial (a) et des 
transformants individuels caracteristiques 6-1 et 2b (b-c), au cours du 
developpement. 

L'activite gus est exprimee en unites de fluorescence par 
20 minute et par : 

- 1 pg de proteines (racines) 

- 20 pg de proteines (feuilles) 

A 2,72 unites de fluorescence correspond 1 pmol du produit 
25 mu, qui est le produit de la catalyse enzymatique du substrat mug (4- 
methyl-p-D glucuronide) par GUS. 

La figure 7 illustre le vecteur obtenu a la suite du « Kanamycin 
rescue ». La technique de « kanamycine rescue » utilise le vecteur P38 
o (a), qui comporte le debut du gene Nptll de resistance a la kanamycine, 
jusqu'au site Pstl, en aval d'un promoteur IS50. Apres digestion par Pstl 
du vecteur P38 et de I'ADN du transformant, ligation des deux et 
selection sur kanamycine, on obtient le vecteur montre en b). L'insert 1 
est le fragment Pstl obtenu a partir de I'ADN genomique du 
5 transformant: il comporte la region promotrice (SEQ ID N°1, net 1 a 
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2149) accolee au fragment cTADN-T delimite par le site d'insertion cote 
RB et le site Pstl situe dans le gene de la kanamycine (figure 8, net 632 
a 4279). Le gene de resistance a la kanamycine se trouve ainsi 
reconstitue et le vecteur recombinant est selectionne sur kanamycine. 

5 

La figure 8 donne une representation schematique de I'ADN-T 
de PGKB5 utilise pour creer la collection de transformants de Versailles. 

La figure 9 illustre la sequence de I'ADN-T de PGKB5, 
10 egalement referencee comme la sequence SEQ ID N°5. 

- RB bordure de 24 pb: 574-596, 

- gene gus : sequence gus sans promoteur : 638-2504 
15 (ATG:638-640, codon stop: 2444-2446), site de polyadenylation du gus: 

3'nos: 2505-2793, site EcoRI: AATT/C:2759-2763. 

- gene KanR : promoteur nos: 4752-4480, sequence KanaR: 
4479-3490 (ATG: 4466-4464, codon stop : 3665-3663, site Pstl: 
CTGCA/G : 4275-4280), site ocs3': 3489-2794. 

20 - gene PhosphinothricineR (bastaR): promoteur 35S: 4767- 

5890, sequence phosphinotricineR: 5890-6503 (ATG:5930-5932, codon 
stop: 6480-6482), site 3'g7: 6504-6789. 

- LB bordure de 24 pb: 6962-6986. 

La figure 10 represente une carte detaillee du vecteur pC-gus 
25 utilise dans Texemple 5. 

EXEMPLES: 

MATERIELS ET METHODES: 

30 

I - Transformation 

(Bechtold N., Ellis J., Pelletier G. , 1993. Agrobactehum 
mediated gene transfer by infiltration of adult Arabidopsis thaliana 
plants. C.R Acad. Sci. Paris 316: 1194-1199.) 
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6 mg de graines (soit environ 300 graines) d'Arabidopsis 
thaliana d'ecotype Wassilevskija ont ete semes sur des bacs de compost 
40 x 30 cm. Les bacs sont laisses 64 h a 4°C pour la germination, puis 
5 sont places en serre (photoperiode : 16h de jour, temperature : 15° C 
nuit / 25°C minimum jour) et arroses avec la solution nutritive standard 
de CoTc et Lessaint (CoTc, Y., Lessaint, C. 1971. Comment assurer une 
bonne nutrition en eau et ions mineraux en horticulture. Hortic. fr.8:11- 
14). 

10 MP5-1 Agrobacterium est cultive dans du milieu LB ( Luria- 

Bertani, Sambrook, J., Fritsch, E. F., Maniatis.T- 1989. Molecular Cloning 
: A Laboratory Manual. Cold Spring Harbor, New York ) avec 50 mg/l de 
rifampicine, 100 mg/l de gentamycine et 200 mg/l de kanamycine, 14h a 
28°C (jusqu'a A600=0.8). Apres centrifugation, le culot de bacteries est 

15 remis en suspension dans le milieu d'infiltration (Ml) t a un tiers du 
volume de culture initial (Ml= macro et micro nutriments de Murashige et 
Skoog, contenant 10 pg/l 6-benzylaminopurine et 5% sucrose 
(Murashige, T., Skoog, F. 1962. A revised medium for rapid growth and 
bioassays with tobacco tissue cultures. Physiol Plant 15 : 473-497). Des 

20 lots de 100 a 500 plantes de 3 a 4 semaines bien developpees ont ete 
extraits du sol, rinces a I'eau, immerges dans 21 de milieu Ml contenant 
Agrobacterium dans une cloche a vide de 101 de contenance. Les 
plantes sont maintenues sous vide (10 4 Pa) pendant 20 mn. Toutes les 
manipulations des plantes traitees, jusqu'a leur recolte, ont ete 

25 effectuees avec des gants en latex. Les plantes traitees ont ete plantees 
dans un nouveau compost, a raison de 54 plantes par bac, puis 
incubees 2 jours sous un plastique pour prevenir toute deshydratation et 
pour faciiiter I'enracinement. Quatre a six semaines apres la plantation, 
la generation T1 a ete recoltee en melange. Les plants ont ete 

30 seiectionnes sur du sable irrigue avec de I'eau contenant de I'herbicide 
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Basta (5-10 mg/ml phosphinothricine). Deux mois plus tard, les graines 
T2 ont ete recoltees individueliement et conservees pour les analyses 
ulterieures. 

5 II - « Kanamycin rescue » 

(Bouchez D., Vittorioso P., Courtial B., Camilleri C, 1996. 
Kanamycin Rescue: A Simple technique for the recovery of T-DNA 
flanking sequences. Plant MoL Biol. Rep. 14: 115-123.) 

10 

■ Extraction de I'ADN genomique 

De 0,5 a 0,75g de feuilles sent congetes rapidement dans 
I'azote liquide, broyes, en presence de polyclar™, en fine poudre dans 

15 un mortier a I'aide d'un piion, et la poudre est transferee avec I'azote 
liquide dans un tube "Oak Ridge", dans lequel sont ajoutes 15ml de 
tampon d'extraction (Tris 100mM, EDTA 50mM, NaC !500mM, p- 
mercaptoethanol 10mM, pH8). Apres addition de 1ml de SDS 20%, les 
tubes sont incubes a 65°C pendant 10mn en agitant toutes les 3 a 4mn. 

20 5ml d'acetate de potassium (5M) sont ajoutes et incubes a 0°C pendant 
au moins 20mn. Apres centrifugation a 25000g (13000rpm) pendant 
20mn, le surnageant est filtre a travers un filtre Miracloth (Calbiochem) 
dans un tube de 30ml contenant 10ml d'isopropanol et incube a -20°C 
pendant 30mn. Apres centrifugation a 20000g (10000 tpm) pendant 

25 15mn, le culot d'ADN est seche en renversant le tube sur du papier 
absorbant pendant 10mn. L'ADN est repris dans 0,7ml de TE 50/10 (Tris 
50mM, EDTA 10mM pH8) auxquels sont ajoutes 5 pi de RNAse 
(5mg/ml) et incube a 37°C pendant 10mn. L'ADN est extrait par un 
volume egal de phenol/chloroforme 1/1 et precipite a I'isopropanol 
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(1 volume)/ NaOAc (3M) (1/10 de volume). Le culot d'ADN est seche et 
repris dans 1 OjjI de TE 10/1 (Tris 10mM, EDTA 1mM, pH8). 

- Clonage 

5 

Premiere digestion. 0.5 pg d'ADN genomique ti'Arabidopsis 
sont digeres avec Pstl (BRL life technologies, 95613, Cergy-Pontoise), 
precipites a I'ethanol (2.5 volumes)/ NaOAc 3M (1/10 du volume) et 
remis en suspension dans de I'eau. 2.5 pg du vecteur pResc38 sont 

10 digeres par Pstl, dephosphoryles avec de la phosphatase alcaline 
d'intestin de veau (BRL), extraits avec un volume de phenol- 
chlorophorme (1/1) precipites a I'ethanol/ NaOAc, et remis en 
suspension dans de I'eau. 

Premiere ligation. 0.5 pg d'ADN genomique digere par Pstl et 

is 2.5 pg de pResc38 digere par Pstl et dephosphoryle sont mis a liguer 
dans 100 pi de volume total avec 5 unites de T4 ADN ligase (BRL), toute 
la nuit a12°C. 

Deuxieme digestion. Le melange de ligation precedent est 
precipite a I'ethanol (2.5 volumes)/ NH40Ac 8M (1/2 du volume), remis 

20 en suspension dans de I'eau, et completement digere avec un deuxieme 
enzyme de restriction : Xbal, dans un volume total de 100 pi en utilisant 
20 unites d'enzyme de restriction. Le melange est precipite a 
rethanol/NH40Ac et mis en suspension dans de I'eau. 

Deuxieme ligation. Afin de circulariser les molecules d'ADN, 

25 une deuxieme ligation est realisee sur le produit de la deuxieme 
digestion avec une concentration d'ADN plus faible, dans un volume total 
de 200 pi et en utilisant 5 unites de T4 ADN ligase. Le melange est 
incube toute la nuit a 12°C, puis precipite a I'ethanol/ NH40Ac, rince 2 
fois a I'ethanol 70% (v/v), seche, et repris dans 20 pi d'eau. 

30 
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- Transformation 

L'electroporation est realisee grace a un appareil de type Gene- 
Pulser (Bio-Rad Laboratories, Richmond, CA) avec un voltage de 1 t 5 kV. 

5 Les cellules electrocompetentes DH10B electromax (BRL) sont 
rapidement decongelees puis piacees sur la glace. Dans une cuvette 
d'electroporation froide (diametre interelectrode de 1mm, Bio-Rad), sont 
melanges 2 pi du produit de ligation precipite et 40 pi de cellules 
competentes. Apres electroporation, 1 ml de milieu SOC froid 

io (Sambrook, J., Fritsch, E. F., Maniatis f T. 1989. Molecular Cloning : A 
Laboratory Manual. Cold Spring Harbor, New York) est ajoute 
immediatement. L'ensemble est transvase dans un tube de culture de 
13 ml et incube 2h a 37°C sous agitation. 

Un volume de 250 pi de culture est etale sur des bottes de Petri 

15 LB-agar contenant 100 mg/l de carbenicilline et 50 mg/l de kanamycine 
et incube a 37°C toute la nuit. 

Ill - Clonage dans Pbin19 

20 L'insert clone dans le vecteur P38resc de "Kanamycin rescue" 

subit un clonage intermediate dans le vecteur Bluescript pBKS+ 
(Stratagene, San Diego CA92121) avant d'etre clone dans le vecteur 
binaire pBin19 en vue de la transformation des plantes. Ces clonages se 
font de maniere directionnelle par double digestion EcoRI/Xbal. 

25 Environ 250 ng de vecteur P38resc contenant Tinsert et digere 

par EcoRI et Xbal sont ligues avec environ 100 ng de vecteur KS+ 
digere par les memes enzymes, non dephosphoryle, dans 40 pi de 
volume final avec 10 U de T4 ADN ligase (BRL). Apres incubation une 
nuit a 12 °C, le melange de ligation est precipite a I'ethanol/ NH40Ac, 

30 repris dans 10 pi d'eau et utilise pour electroporer des bacteries NM522 
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(BRL), rendues electrocompetentes suivant la technique decrite par 
Sambrook et a/.,(1989). Les colonies positives blanches sont 
selectionnees sur un milieu LB-agar contenant 40 mg/l de XGal t 8 mg/l 
d'IPTG (Genaxis Biotechnology, 78180, Montigny le Bretonneux) et 
5 100mg/l de carbenicilline. 

- Clonaqe dans pBin19 . 

L'insert contenu dans pBKS+, apres digestion par EcoRI et 
io Xbal, est purifie par electrocution a partir d'un gel d'agarose a 1%, selon 
la technique de Sambrook et a/., (1989). Pour le clonage, 100ng de 
l'insert de 4.3 kb et 100ng de vecteur pBin19 (12 kb) prealablement 
digere par EcoRI et Xbal (soit un rapport molaire insert/vecteur de 3/1) 
sont melanges dans 40 pi de volume total avec 10 pi de ligase (BRL) et 
15 ligues sur la nuit a 12 °C. Apres precipitation a I'ethanol/ NaOAc t le 
produit de ligation est repris dans 10 pi d'eau et utilise pour reaiiser 
I'electroporation des bacteries NM522. La selection des colonies 
positives se fait sur des boites de Petri avec un milieu LB-agar contenant 
XGal et IPTG, comme ci-dessus et 50mg/l de kanamycine. 

20 

IV - Methode a I'exonuclease ill 

(Current Protocols in Molecular Biology, editeurs: F.M. Ausubel, 
R. Brent, R.E. Kingston, D.D. Moore, J.G. Seidman, J.A. Smith, K. 
25 Struhl; published by Wiley Interscience) 

Le fragment d'ADN d'interet de 4 t 3kb a ete redone dans un 
vecteur pBluescript II KS+ au site EcoRI du polylinker. Ensuite le 
plasmide de ce clone a ete isole et purifie par la methode de "Qiagen- 
Midi-Preparation Tip 100( Qiagen) a partir d'une culture de 30 ml. 
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Pour pouvoir sequencer dans les deux sens : 5ug plasmide ont 
ete doublement digeres par Xhol/Kpnl d'une part et par Spel/Saci d'autre 
part, dans un volume de 50 |jf chaque fois. (100ng de plasmide linearise 
de chaque digestion a ete garde pour une verification sur gel d'agarose). 
5 Le reste du plasmide linearise a chaque digestion a ete precipite a 
I'ethanol 95% (3 volumes) et NaOAc 3M (1/5 volume) pendant une heure 
dans la glace. Apres 20 minutes de centrifugation a 13000 tpm et a +4°C 
, le plasmide digere de chaque digestion a ete rince avec I'ethanol a 
70%, seche au "speed-vac" pendant 5 minutes et repris dans 50pl de 

10 tampon Exolll dilue a 1x (0,66M Tris/HCI pH=8,0 , 66 mM MgCI 2 , 50mM 
DTT, SOOpg /mi BSA; USB, United States Biochemicals). 

Pour creer les deletions de chaque cote, 25|jl ( 2 T 5fjg ) de 
chaque digestion ont ete preincubes a 37°C pendant 2 minutes, 0,8(jI de 
Exolll (100u/pl; USB), soit 150unites Exolll par picomole d'extremites 3', 

15 ont ete ajoutes et reincubes a 37°C. Toutes les minutes, 3jjI (300ng) 
d'ADN ont ete preleves et places immediatement dans la carboglace (=8 
prelevements totaux). Puis 3|jI d'eau ont ete ajoutes a chaque 
prelevement , incubes pendant 10 minutes a 70°C pour inactiver 
Tenzyme Exolll. Tous les echantiilons ont ete places dans la giace. 

20 Apres addition de 15 pi de tampon de nuclease S1 (300mM Na acetate 
pH 4,6 f 10mM Zn acetate, 50% v/v glycerol) et de 4pl (4 unites) de 
nuclease S1 (Gibco BRL) , ces echantiilons ont ete incubes pendant 20 
minutes a temperature ambiante. La reaction de la nuclease S1 a ete 
arretee en ajoutant 5pl de tampon "stop" (0,3M Tris/HCI pH 8,0 , 0,05M 

25 EDTA) a chaque echantillon . Des fractions aliquotes de 8pl ont ete 
prelevees pour une verification sur gel d'agarose. 

Le volume restant (22pl) de chaque echantillon a ete incube 
pendant 20 minutes a 37°C apres avoir ajoute 2 unites de fragment de 
Klenow et 1pl de dNTP's a 0,25mM. 

so Enfin les molecules deletees ont ete recircularisees en ajoutant 

1 pi 0 unit e) de T 4 DNA ligase (USB), 3pl de tampon 10x (660mM 
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Tris/HC! pH=7,6, 66mM MgCI 2 , 100mM DTT, 660pm ATP) et 2pi d'eau a 
chaque echantillon. Les ligations ont ete faites dans un volume total de 
30 pi et incubees a 16 °C pendant la nuit. 

Puis un tiers du volume (10jjI) des produits issus de chaque 
5 ligation a ete utilise pour transformer 100pl de cellules competentes 
E.coli DH5a par la methode au Chlorure de Calcium ( Current Protocols 
in Molecular Biology, editeurs: F.M. Ausubel, R. Brent, R.E. Kingston, 
D.D. Moore, J.G. Seidman, J.A. Smith, K. Struhl,; published by Wiley 
Interscience ) . Les cellules transformees de £. cofi DHSot ont ete 
10 selectionnees sur LB-agar contenant de la carbenicilline a 100mg/l , 40 
mg/l de XGal et 8 mg/l d'IPTG. 

V - Extraction des ARN totaux 

15 (Heim U., Weber H., Baumlein H., Wobus U. f 1993. A sucrose- 

synthase gene of Vicia faba L.; expression pattern in developing seeds in 
relation to starch synthesis and metabolic regulation. Plants 191: 3494- 
501) 

20 Les tissus frais congeies (plantule ~2g et racine ~1g) ont ete 

ecrases dans I'azote liquide a I'aide d'un mortier et un pilon. Puis SOOjjI 
de tampon d'extraction (1M Tris/HCI pH 7,4 , 1% SDS , 5mM EDTA) 
pour 200mg tissu ont ete ajoutes goutte a goutte, puis le meme volume 
de phenol/chloroforme/isoamylalcohol, tout en continuant le broyage 

25 jusqu'a obtenir une poudre lisse. Apres decongelation, chaque solution a 
ete transferee dans un tube et centrifugee pendant 5 minutes a +4°C . 

Chaque phase aqueuse a ete reextraite deux fois avec le meme 
volume de phenol/chloroforme/isoamylalcohol et precipitee a Tethanol (3 
volumes) / NaOAC (1/10 volume) pendant une heure a -80°C. Apres 

30 centrifugation pendant 30 minutes a +4°C, chaque culot a ete seche 
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brievement et dissous dans de I'eau+DEPC Line deuxieme 
centrifugation pendant 10 minutes a +4°C a ete faite et chaque 
surnageant a ete melange avec le meme volume de LiCI a 4M pour une 
precipitation des acides ribonucleiques dans la glace a +4°C pendant la 
5 nuit. 

Ensuite chaque solution a ete centrifugee pendant 15 minutes 
et les culots d'ARN ont ete laves deux fois dans LiCI 2M et une fois dans 
de I'ethanol a 70% . Apes un sechage au "speed-vac , chaque culot 
d'ARN a ete dissous dans de I'eau+DEPC et la concentration d'ARN a 
10 ete verifiee par spectrophotometrie. 

VI - Test GUS 

(Jefferson R. A., 1987. Assaying chimeric genes in plants: the 
gus gene fusion system. Plant Mol. Biol. Rep. 5: 387.) 

15 

— Par histochimie 

Quinze jours apres la germination des transformants 
d'Arabidopsis, P activite GUS est testee grace a I'acide X-glucuronique 
20 (X-Glu, Biosynth G. Staad, Suisse) comme decrit par Jefferson et a/., 
modifie par I'utiiisation de 100 mM KH2P0 4 , 0.4 mM de catalyseur 
K3Fe(CN)6 et 0.4 mM K4Fe(CN)6. Aucun bruit de fond n'a ete observe 
dans les tissus des plantes non transformees. 
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- Par fluorimetrie 

Les echantillons de plantes (racines ou feuilles) sont broyes en 
tube Eppendorf™ avec 200 |jl de tampon d'extraction ( 50mM NaP0 4? 10 
5 mM dithiothreitol t 10 mM EDTA, pH7) et une pincee de sable de 
Fontainebleau. Apres centrifugation deux fois 10 min a 13000tprn a 4°C, 
le dosage d'activite GUS est realise sur le surnageant, dans 150pl de 
volume final contenant le substrat MUG (4-Methyl-p-D-glucuronide 
d'ombellifere, Sigma) a concentration finale de 3 mM. 
io Apres 15 min d'incubation a 37°C, I'activite GUS est mesuree 

grace a un appareil Fluoroskan II ( Labsytems, 91944 Les Ulis, France) 
avec des longueurs d'onde d'excitation et d'emission de 365 nm et 455 
nm, respectivement. 

Les concentrations de proteines dans les extraits de plantes 
15 sont mesurees en utilisant le reactif de Bradford (Biorad). 

Les concentrations d'ADN sont mesurees en utilisant le reactif 
de Hoechst (Sigma). La reaction se fait dans 200 y\ de volume final 
(tampon Labarca-Paigen : 50 mM NaP0 4 , NaGI 2M, EDTA 2mM, pH 7.5) 
contenant le reactif de Hoechst a 0.5 mg/ml. 

20 

EXEMPLE 1: Is olement d'une sequence nucleotidique d'environ 2,2 
kb par pieqeaqe de promoteur. 

Une collection de transformants d'Arabidopsis thaliana (ecotype 
25 WS) a ete obtenue selon la technique decrite par Bechtold et al. (1993). 

Les plantes ont ete transformees par insertion aleatoire dans 
leur genome d'un ADN de transfert (ADN-T) transmis par la bacterie 
Agrobacterium tumefaciens. 
30 Cet ADN de transfert comporte un gene gus sans promoteur tel 

que decrit par Bouchez et ai (1993, C.R.A.S. Paris, volume 316:1188- 
1193). 
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La methode de transformation In plants a ete choisie et mise au 
point a la Station Genetique de Versailles de IMnstitut National de la 
Recherche Agronomique selon la methode decrite par Bechtold et ai 
(1993, C.R.A.S. Paris, volume 316:1194-1199). Cette methode permet 
5 d'obtenir rapidement un nombre eleve de transformants independants 
comportant un nombre limite d'insertions (1,5 insertions par transformant 
en moyenne). 

Un criblage de I'expression du gene GUS par histochimie parmi 
les transformants selon la methode decrite par Mollier et ai (1995, 
io C.R.A.S. Paris, volume 318: 465-474) a permis d'isoler un transformant 
presentant une activite GUS particuliere: 

• expression tres forte specifiquement dans la racine, et ce tout 
au long du developpement, comme montre dans les cliches 

15 correspondant a la figure 3a-c. La racine est coloree sur toute la 
longueur sauf la zone d'elongation (figure 3d). 

• expression dans toutes les assises cellulaires de la racine 
(epiderme, cortex, endoderme, pericycle, vaisseau conducteur) telle que 

20 cela peut etre observe sur le cliche de la figure 4. 

Ce transformant a ete caracterise plus avant par la technique 
de Southern blot (Southern E.M.,1975). 

25 Une sequence d'environ 2,2 kb situee en amont de la bordure 

droite de Tinsertion, correspondant au promoteur, a ete donee par la 
technique de « Kanamycin Rescue » seion la technique decrite par 
Bouchez et ai. (1996, Plant Mol. Biol. Rep. vol. 14:115-123). 

Le vecteur de « Kanamycin rescue » est represents en figure 7. 

30 

EXEMPLE 2 : Recherche de la sequence complete du promoteur 
selon rinvention. 

Le fragment d'ADN de 2,2 kb a ete utilise comme sonde pour 
35 rechercher le promoteur entier dans une banque d'ADN genomique 
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d'Arabidopsis thaliana d'ecotype Columbia (J.T. Mulligan, Stanford CA 
94305). 

Deux phages d environ 15 kb ont ete selectionnes (clones Ir1 et 
Ir2).. Ces deux clones de phages comportaient un insert correspondant a 
5 un fragment genomique de 4,413 kb (SEQ ID N°3) et contenant la 
sequence de la sonde. L'insert de ces deux phages a ete entierement 
sequence par la methode a Texonuclease III decrite par Ausubel et aL 
(Current Protocols in Molecular Biology, editeurs. F.M. AUSUBEL, R. 
BRENT., R.E. KINGSTON, D.D. MOORE, J.G. SEIDMAN, J.A. SMITH, 
io K. STRUHL; published by Wiley Interscience). II s'agit de la sequence 
SEQ ID N°3 . Le debut de la sequence correspondant a I'ADN-T est 
localise a partir du nucleotide en position 2285 de la sequence SEQ ID 
N°3. 

L'expression specifique du gene gus a ete mise en evidence 
15 par des experiences de Northern blot sur des ARN totaux extraits de 
transformants homozygotes pour rinsertion. 

Les resultats d'une experience de Northern blot sont 
representes a fa figure 5. 

Un transcrit d'environ 2 kb est mis en evidence sur les ARN de 
20 racine et n'est pas detectable sur les ARN des parties aeriennes (figure 
5). 

Les ARN totaux ont ete extraits de racines et de parties 
aeriennes de la lignee transformee selon la methode decrite par Heim et 
al. (1993, Planta, vol. 191; 3.494, 3501). 

25 En vue de mettre en evidence un eventuel transcrit endogene 

correspondant au promoteur, des gels de Northern ont ete realises sur 
des ARN totaux extraits de plantes non transformees, et hybridees avec 
le fragment genomique de 4,413 kb (SEQ ID N°3) qui contient environ 
2,2 kb en aval du promoteur. 

30 Aucun transcrit n'a ete detecte avec cette sonde. 

En outre, deux banques d'ADNc d'Arabidopsis thaliana 
independantes (une banque d'ADNc de racines et une banque d'ADNc 
de plantes entieres) ont ete criblees avec cette meme sonde de 4,413 
kb. 
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A nouveau, !es resultats ont ete negatifs et aucun ADNc 
correspondant au promoteur n'a ete trouve. 

Enfin, aucune phase codante n'a pu etre mise en evidence en 
aval du promoteur en utilisant les logiciels classiques de prediction. 
5 Logiciels Net Plant Gene et Net Gene 2: 

S.M. Hebsgaard etal.(1996). 

Brunak S. et al. (1991). 
Logiciel Genscan: 

Burge, C. et al. (1997); 
10 Burge, C.B. (1998). 

La sequence de 4,413 kb (SEQ ID N°3) est tres riche en bases 
A et T (68% de A et de T) et comporte 67 motifs ATG, 20 motifs CAAT, 
38 motifs TATA, 9 motifs TATAAT et 2 boites Cr. 
15 Les resultats obtenus indiquent qu'aucun transcrit n'est 

decelable en aval du promoteur etudie. II s'agirait done d'un promoteur 
cryptique. 

EXEMPLE 3: Mise en evidence de 1'activite promotrice. 

20 

L'activite promotrice a ete demontree en realisant une 
retransformation in planta d'Arabidopsis thaliana (ecotype WS) par ce 
promoteur de 2,2 kb place en amont du gene rapporteur gus. 

Pour cette experience, la construction suivante a ete reaiisee, 
25 qui est representee sur la figure 2: un fragment d'environ 4,27 kb 
compris entre les sites Xbal et EcoRI du vecteur de « kanamycin 
Rescue » (cf. figure 7) a ete clone dans I'ADN-T du vecteur pBin19 selon 
la technique decrite par Bevan M. (1984, Nucleic Acid Research vol.12: 
8711-8721). 

30 Ce fragment d'ADN de 4,27 kb est inclus dans la sequence 

SEQ ID N°4, cette sequence comprenant egalement un polysite de 
clonage du vecteur P38, comme decrit ci-apres. 

II comporte: les sites de clonage de P38: Xbal, Spel, BamHI, 
Smal, Pstl (net 1 a 29), la sequence promotrice SEQ ID N°1 (net 30 a 
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2178) et la sequence du gene gus de I'ADN-T de PGKB5 jusqu'au site 
EcoRI (net 2179-4309). 

EXEMPLE 4: Transformation de plantes d'Arabidopsis thaliana 
5 avec la construction contenant le gene gus place sous le controle 
du promoteur. 

Des plantes d'Arabidopsis thaliana ont ete transformees via 
Agrobactehum tumefaciens avec la construction 1 decrite dans la figure 
10 2 et neuf transformants individuels ont ete etudies pour I'expression du 
gene gus, d'abord en histochimie. 

L'expression du gene gus a egalement ete quantifiee par 
dosage fluorimetrique selon la technique decrite par Jefferson (1987, 
15 Plant, Mol. Biol. Rep. volume 5: 387), modifiee par I'utilisation de 5mM 
de substrat dans les racines d'une part, et dans les parties aeriennes 
(cotyledons, feuilles, tiges), d'autre part, et ce ? a plusieurs stades du 
developpement des plantes. 

L'activite du gene gus des neuf transformants a ete comparee a 
o celle du transformant initial. 

Les resultats sont representes sur le tableau I ci-apres. 

Pour le transformant de depart ACC 6 H, a Tetat homozygote, ou 
ACC 6 T 3t en segregation, l'activite du gene gus dans les racines diminue 
avec Page de la plante, alors qu'une faible activite dans les parties 
5 aeriennes devient detectable en fin de developpement. 

Pour 6 des 9 transformants etudies (transformants 6i, 6h, 6-1, 
6-2, 6-3 et 6a) Tactivite du gene gus dans les racines est encore plus 
forte que dans celle du transformant de depart (4 a dix fois ) et Tactivite 
dans les feuilles devient plus facilement detectable, 
o Cependant, le rapport activite du gene gus dans les 

racines/activite du gene gus dans ia feuille reste constant. 

Pour ces transformants, la specificite racinaire est done 
inchangee par rapport au transformant de depart. Seul le niveau 
d'expression du gene gus est globalement plus eleve. 
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Pour 3 des transformants (6b, 2b et 6k) le rapport activite du 
gene gus dans la racine/activite du gene gus dans la feuille est plus 
faible que dans le transformant de depart; 1'expression du gene gus est 
done moins specifique des racines pour ces transformants. 
5 La diminution de I'activite GUS dans les racines au cours du 

developpement est illustree en figure 6, pour le transformant initial (a) et 
deux transformants caracteristiques (b et c). Pour le transformant initial, 
I'activite dans les feuilles n'est pas detectable. Pour le transformant 6-1, 
elle est faiblement detectable, et le rapport activite GUS racine/feuille est 
10 le meme que pour ie transformant initial. Pour le transformant 2b par 
contre, I'activite GUS dans les feuilles est plus elevee, et le rapport 
racine/feuille est nettement diminue. 

EXEMPLE 5 : Etude de deletions du promoteur selon I'invention 

15 

Des deletions du promoteur ont ete obtenues selon la methode a 
I'exonuclease III decrite dans la partie Materiels et Methodes (Section IV) 
afin d'obtenir des fragments fonctionnels du promoteur. 

20 Digestion du fragment genomique a I'aide de l f exonuclease III 

En premier lieu, le fragment genomique de 4.3 kb (sequence SEQ 
ID N° 3) a ete clone dans un vecteur pBluescript KS+, au site EcoRI, 
puis a subi des digestions partielles en 5' par I'exonuclease III. 

25 Clonage des fragments obtenus dans un vecteur depression 
fonctionnel chez les plantes 

Afin de tester I'activite promotrice des fragments deletes du 
promoteur, les fragments obtenus apres digestion enzymatique a I'aide 
de I'exonuclease III dans le vecteur pBluescript KS+, ont ete amplifies 
30 puis clones dans un vecteur possedant le gene gus, 

Les fragments du promoteur sont amplifies par PCR a I'aide de 2 
amorces portant des sites enzymatiques, respectivement: 
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- en 5' du promoteur, on utilise Pamorce T7-Hindlll, situee dans le 
vecteur KS+ ; 

- en 3' du promoteur, on utilise une amorce choisie dans la 
sequence genomique de 4.3kb et portant un site BarnHI: 

5 

II s'agit des amorces suivantes : 

a) amorce T7-Hindlll. en 5' : GGC AAG CTT GTA ATA CGA CTC ACT 
ATA GGG C (SEQ ID N°6), qui possede la sequence " A/AGCTT " 
reconnue par I'endonuclease de restriction Hind III. 

10 

b) amorce en 3' : CTA GGG ATC CAG CCA TTC CCT ATG C (SEQ ID 
N°7), qui possede la sequence " GGATC/C " reconnue par 
I'endonuclease de restriction BamHI. La sequence de cette amorce 
situee du cote 5\ par rapport au site BamHI est complementaire de la 

15 sequence allant du nucleotide en position 2400 jusqu'au nucleotide en 
position 2386 de la sequence SEQ ID N°3. 

Protocole d' amplification par PCR 

Sont melanges pour chaque echantillon: 
20 40 pi d'H 2 0 

5 pi tampon PCR 10x 
1 pi dNTP 10 mM 

1pl enzyme pfu-turbo DNA polymerase (a 2.5 u/mI, Stratagene) 
1 Ml d'amorce T7-Hind III ( a 10 mM) 
25 1 Ml d'amorce 4.4-BamHI ( a 10 mM) 

1 Ml d'ADN matrice (10 ng d'ADN du clone d'exonuclease choisi) 

Reaction PCR ;: 

L'amplification proprement dite est realisee dans les conditions 
30 suivantes : 
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a) Etape de denaturation pour I'obtention de fragments d'ADN simple 
brin a 94°C pendant 4 minutes ; 

b) Trente cycles d'amplifications realises dans les conditions suivantes : 
5 - denaturation a 94°C pendant 30 secondes ; 

- hybridation des amorces a 50°C pendant 45 secondes ; 

- elongation des amorces a 72°C pendant 3 minutes 

c) Derniere etape d'eiongation realisee a 72°C pendant 10 minutes. 

io Les fragments de promoteur ainsi amplifies component done les 

sites Hind III, du cote 5\ et BamHI, du cote 3'. 

Les fragments amplifies sont ensuite clones au niveau des sites 

Hind III et BamHI, done de fa?on orientee, dans le vecteur pC-gus dont 

la carte detailiee est representee a la Figure 10. Le clonage a ete realise 
is conformement a ia technique decrite dans la partie Materiels et 

Methodes (Section III) pour le vecteur pBin19. 

Les fragments clones en amont du gene gus dans le vecteur pC-gus 
sont: les suivants : 

20 - Le fragment allant du nucleotide en position 1 jusqu'au 

nucleotide en position 2400 de la sequence SEQ ID N°3 ; 

Le fragment allant du nucleotide en position 493 jusqu'au 
nucleotide en position 2400 de la sequence SEQ ID N°3 ; 

Le fragment allant du nucleotide en position 1076 jusqu'au 
25 nucleotide en position 2400 de la sequence SEQ ID N°3 ; 

Le fragment allant du nucleotide en position 1976 jusqu'au 
nucleotide en position 2400 de la sequence SEQ ID N°3 ; 

Le fragment allant du nucleotide en position 2040 jusqu'au 
nucleotide en position 2400 de la sequence SEQ ID N°3 ; 

30 
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Transformation de cellules d'Agrobacterium tumefaciens 
avec les vecteurs recombinants contenant divers fragments du 
promoteur selon I'invention 

Les vecteurs pC-gus contenant les differents inserts sont ensuite 
transfers dans la souche d'Agrobacterie et des plantes d'Arabidopsis 
WS sont transformees conformement au protocole decrit a la Section I 
de la partie Materiels et Methodes. 

Les graines des transformants primaires sont selectionnees sur 
un milieu selectif contenant de l'hygromycine (30 mg/l). 

La descendance de 20 transformants primaires par construction 
est semee sur milieu hygromycine afin de selectionner les transformants 
possedant un seul locus d'insertion de I'ADN-T de Agrobacterium 
tumefaciens. Les homozygotes de ces transformants sont etudies pour 
I'expression de la proteine GUS dans les racines et dans les feuilles, a la 
fois qualitativement par histochimie et quantitativement par fluorimetrie, 
conformement aux protocoles decrits dans la Section VI de la partie 
Materiels et Methodes. 
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REVENDICATIONS 

1. Acide nucleique comprenant tout ou partie d'un promoteur 
vegetal capable de diriger ['expression d'une sequence nucleotidique 
d'interet dans les cellules de la racine d'une plante, durant la totalite du 

5 developpement de cette derniere caracterise en ce qu'il comprend tout 
ou partie d'un polynucleotide possedant au moins 80 % d'identite en 
nucleotides avec la sequence nucleotidique SEQ ID N° 1, ou un acide 
nucleique de sequence complernentaire, a I'exception de la sequence 
references sous le N°AC 007 289 dans la base de donnee EMBL. 

10 

2. Acide nucleique selon la revendication 1, caracterise en ce 
qu'il comprend tout ou partie d'un polynucleotide hybridant, dans des 
conditions d'hybridation de forte stringence, avec la sequence 
nucleotidique SEQ ID N°1, ou un acide nucleique de sequence 

15 complernentaire. 



3. Acide nucleique selon I'une des revendications 1 ou 2 t 
caracterise en ce qu'il comprend I'une des sequences suivantes: 

20 - le polynucleotide allant du nucleotide en position 1 jusquau 

nucleotide en position 2400 de la sequence SEQ ID N°3; 

- le polynucleotide allant du nucleotide en position 493 jusquau 
nucleotide en position 2400 de la sequence SEQ ID N°3; 

- le polynucleotide allant du nucleotide en position 1076 
25 jusqu'au nucleotide en position 2400 de la sequence SEQ ID N°3; 

- le polynucleotide allant du nucleotide en position 1976 
jusqu'au nucleotide en position 2400 de la sequence SEQ ID N°3; et 

- le polynucleotide allant du nucleotide en position 2040 
jusqu'au nucleotide en position 2400 de la sequence SEQ ID N°3. 
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4. Acide nucleique selon Tune des revendications 1 a 3, 
caracterise en ce qu'il comprend une sequence nucleotidique d'interet 
placee sous le controle du promoteur vegetal. 

5 5. Acide nucleique selon la revendication 4, caracterise en ce 

qu'il s'agit de la sequence nucleotidique SEQ ID N° 2. 

6. Acide nucleique selon la revendication 4, caracterise en ce 
que la sequence nucleotidique d'interet est choisie parrni les sequences 

10 codantes de genes interagissant avec des parasites ou des pathogenes, 
les sequences codant les endochitinases, les sequences codant pour 
des proteines de protection de la plante au stress hydrique ou salin, ou 
encore des genes agissant sur la teneur en sucre de la plante ou sur le 
transport de nitrate. 

15 

7. Acide nucleique comprenant 10 a 2000 nucleotides 
consecutifs d'un acide nucleique selon Tune des revendications 1 a 4, 
utile comme sonde ou amorce nucleotidique. 

20 8. Vecteur recombinant de clonage et/ou d'expression 

comprenant un acide nucleique selon Tune des revendications 1 a 7. 

9. Vecteur recombinant selon la revendication 8, caracterise en 
ce qu'il est choisi parmi les vecteurs Pbin19, 101, pBi221, pBi121 et pC- 

25 gus. 

10. Vecteur recombinant selon Tune des revendications 8 ou 9, 
caracterise en ce qu'il s'agit du vecteur contenu dans la souche d 9 E. Coli 
deposee a la CNCM le 25 Mai 1999 sous le Numero d'acces 1-2218. 

30 
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11. Cellule hote recombinante, caracterisee en ce qu'elle 
comprend un acide nucleique selon Tune des revendications 1 a 7 ou un 
vecteur recombinant selon Tune des revendications 8 a 10; 

5 12. Cellule hote recombinante selon la revendication 11, 

caracterisee en ce qu'elle est d'origine bacterienne ou vegetale. 

13. Cellule hote recombinante selon ia revendication 12, 
caracterisee en ce qu'il s'agit d'une cellule d'Agrobacterium tumefaciens. 

10 

14. Cellule hote recombinante selon Tune des revendications 
11 a 13, caracterisee en ce qu'il s'agit d'une cellule de la souche d'E. 
Co// deposee a la CNCM le 25 Mai 1999 sous le Numero d'acces 1-2218. 

15 15: Organisme multicellular vegetal recombinant, caracterise 

en ce qu'il comprend une cellule hote recombinante selon I'une des 
revendications 11 a 13. 

16. Plante transgenique comprenant, sous une forme integree 
20 dans son genome, un acide nucleique selon I'une des revendications 1 

a 7. 

17. Plante transgenique selon la revendication 16, caracterisee 
en ce qu'il s'agit d'un colza, d'un tabac ou d'un mais. 

25 

18. Procede d'obtention d'une plante transgenique caracterise 
en ce qu'il comprend les etapes suivantes : 

a) Obtention d'une cellule hote recombinante vegetale selon 
30 Tune des revendications 11 ou 12 ; 
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b) Regeneration d'une plante entiere a partir de la cellule hote 
recombinante obtenue a I'etape a). 

5 c) Selection des ptantes obtenues a I'etape b) ayant integre la 

sequence nucleotidique d'interet placee sous le controle du 
polynucleotide promoteur vegetal. 



19. Procede d'obtention d'une plante transgenique caracterise 
10 en ce qu'il comprend les etapes suivantes : 

a) Obtention d'une cellule hote recombinante d'Agrobacterium 
tumefaciens selon la revendication 13 ; 

15 b) Transformation de la plante d'interet par infection avec la 

cellule hote recombinante obtenue a I'etape a). 

c) Selection des plantes ayant integre la sequence 
nucleotidique d'interet placee sous le controle du polynucleotide 
20 promoteur vegetal. 

20. Procede d'obtention d'une plante transgenique caracterise 
en ce qu'il comporte les etapes suivantes : 

25 a) transfecter une cellule de plante avec un acide nucleique 

selon Tune des revendications 1 a 7 ou un vecteur recombinant selon 
Tune des revendications 8 a 10; 

b) regeneration d'une plante entiere a partir des cellules de 
30 plantes recombinantes obtenues a I'etape a) ; 
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c) selection des plantes ayant integre la sequence nucleotidique 
d'interet placee sous le controie du polynucleotide promoteur vegetal. 

5 21. Precede d'obtention d'une plante transgenique selon Tune 

des revendications 18 a 20, caracterise en ce qu'il comporte en outre les 
etapes de : 

d) croisement entre elles de deux plantes transgeniques telles 
qu'obtenues a I'etape c) ; 

10 

e) selection des plantes homozygotes pour le transgene. 

22. Procede d'obtention d'une piante transgenique selon I'une 
des revendications 18 a 20, caracterise en ce qu'il comporte en outre les 

15 etapes de: 

d) croisement d'une plante transgenique obtenue a I'etape c) 
avec une plante de la meme espece ; 

e) selection des plantes issues du croisement .de I'etape d) 
ayant conserve le transgene. 

20 

23. Plante transgenique, telle qu'obtenue selon le procede 
selon I'une des revendications 18 a 22. 

24. Semence de piante dont les cellules constitutives 
is comprennent dans leur genome un acide nucleique selon I'une des 

revendications 1 a 7. 

25. Semence d'une plante transgenique selon I'une des 
revendications 16, 17 et 23. 
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1 GGAAACAGCT ATGACCATGA TTACGCCAAG CTCGGAATTA ACCCTCACTA AAGGGAACAA 
61 AAGCTGGAGC TCCACCGCGG TGGCGGCCGC TCTAGAGGAT CCCCCCACAG ACAGCTCCGT 
121 AGCCCTCGTT CTCCTTGGAG TTCTTCGGGA AATGGATCTT TCGATTCCCG ATGATGTCTC 
181 TCTTATCTGC TTTGACGACG CCGACTGGAC ATCCGCTATA ACGCCGCCAT TGACCGTGAT 
241 1TCGCAACCT GTCAGGGATC TCGCGACGGC TGCCACAGAA GACCTGATCG CCCGCTTAAA 
301 GGGCGAGACT TCAGCCCCAC CCAAGGAAAC TCTTCTCCCG GCGGTTCTCA TAGAGCGCGG 
361 TTCCGTAAGC GGTTCTTCGC AAGGTCGGGG TTGCATACCG AACTCGCGAA ACGTCGGCGA 
421 CTGAGCTCCC GAGGCGCGTT GACAAGATGC CACGAAGGGA ATGGAAGACA GCCGATATTG 
481 CAATTGTCTT CGTGGACTGC TTTCGGGACG TAAGGCGCAA GCCATCATCA CCGCCGTCCT 
541 AAACAAACAT ACCTCCACAC AAATTTATCT ACCTGACCAC AAGATATATC CTGTCACACG 
601 ATTTATTAAA CGCTGCACTT GGGGTGGTCA G/TCCCTTATG TTACGTCCTG TAGAAACCCC 
661 AACCCGTGAA ATCAAAAAAC TCGACGGCCT GTGGGCATTC AGTCTGGATC GCGAAAACTG 
721 TGGAATTGAT CAGCGTTGGT GGGAAAGCGC GTTACAAGAA AGCCGGGCAA TTGCTGTGCC 
781 AGGCAGTTTT AACGATCAGT TCGCCGATGC AGATATTCGT AATTATGCGG GCAACGTCTG 
841 GTATCAGCGC GAAGTCTTTA TACCGAAAGG TTGGGCAGGC CAGCGTATCG TGCTGCGTTT 
901 CGATGCGGTC ACTCATTACG GCAAAGTGTG GGTCAATAAT CAGGAAGTGA TGGAGCATCA 
961 GGGCGGCTAT ACGCCATTTG AAGCCGATGT CACGCCGTAT GTTATTGCCG GGAAAAGTGT 
1021 ACGTATCACC GTTTGTGTGA ACAACGAACT GAACTGGCAG ACTATCCCGC CGGGAATGGT 
1081 GATTACCGAC GAAAACGGCA AGAAAAAGCA GTCTTACTTC CATGATTTCT TTAACTATGC 
1141 CGGAATCCAT CGCAGCGTAA TGCTCTACAC CACGCCGAAC ACCTGGGTGG ACGATATCAC 
1201 CGTGGTGACG CATGTCGCGC AAGACTGTAA CCACGCGTCT GTTGACTGGC AGGTGGTGGC 
1261 CAATGGTGAT GTCAGCGTTG AACTGCGTGA TGCGGATCAA CAGGTCGTTG CAACTGGACA 
1321 AGGCACTAGC GGGACTTTGC AAGTGGTGAA TCCGCACCTC TGGCAACCGG GTGAAGGTTA 
1381 TCTCTATGAA CTGTGCGTCA CAGCCAAAAG CCAGACAGAG TGTGATATCT ACCCGCTTCG 
1441 CGTCGGCATC CGGTCAGTGG CAGTGAAGGG CCAACAGTTC CTGATTAACC ACAAACCGTT 
1501 CTACTTTACT GGCTTTGGTC GTCATGAAGA TGCGGACTTA CGTGGCAAAG GATTCGATAA 
1561 CGTGCTGAT3 GTGCACGACC ACGCATTAAT GGACTGGATT GGGGCCAACT CCTACCGTAC 
1621 CTCGCATTAC CCTTACGCTG AAGAGATGCT CGACTGGGCA GATGAACATG GCATCGTGGT 
1681 GATTGATGAA ACTGCTGCTG TCGGCTTTAA CCTCTCTTTA GGCATTGGTT TCGAAGCGGG 
1741 CAACAAGCCG AAAGAACTGT ACAGCGAAGA GGCAGTCAAC GGGGAAACTC AGCAAGCGCA 
1801 CTTACAGGCG ATTAAAGAGC TGATAGCGCG TCACAAAAAC CACCCAAGCG TGGTGATGTG 
1861 GAGTATTGCC AACGAACCGG ATACCCGTCC GCAAGTGCAC GGGAATATTT CGCCACTGGC 
1921 GGAAGCAACG CGTAAACTCG ACCCGACGCG TCCGATCACC TGCGTCAATG TAATGTTCTG 
1981 CGACGCTCAC ACCGATACCA TCAGCGATCT CTTTGATGTG CTGTGCCTGA ACCGTTATTA 
2041 CGGATGGTAT GTCCAAAGCG GCGATTTGGA AACGGCAGAG AAGGTACTGG AAAAAGAACT 
2101 TCTGGCCTGG CAGGAGAAAC TGCATCAGCC GATTATCATC ACCGAATACG GCGTGGATAC 
2161 GTTAGCCGGG CTGCACTCAA TGTACACCGA CATGTGGAGT GAAGAGTATC AGTGTGCATG 
2221 GCTGGATATG TATCACCGCG TCTTTGATCG CGTCAGCGCC GTCGTCGGTG AACAGGTATG 
2281 GAATTTCGCC GATTTTGCGA CCTCGCAAGG CATATTGCGC GTTGGCGGTA ACAAGAAAGG 
2341 GATCTTCACT CGCGACCGCA AACCGAAGTC GGCGGCTTTT CTGCTGCAAA AACGCTGGAC 
2401 TGGCATGAAC TTCGGTGAAA AACCGCAGCA GGGAGGCAAA CAATGAATCA ACAACTCTCC 
2461 TSGCGGACCA TCGTCGGCTA CAGCCTCGGT GGGGAATTGA GCTCGATCGT TCAAACATTT 
2521 GGCAATAAAG TTTCTTAAGA TTGAATCCTG TTGCCGGTCT TGCGATGATT ATCATATAAT 
2581 TTCTGTTGAA TTACGTTAAG CATGTAATAA TTAACATGTA ATGCATGACG TTATTTATGA 
2641 GATGGGTTTT TATGATTAGA GTCCCGCAAT TATACATTTA ATACGCGATA GAAAACAAAA 
2701 TATAGCGCGC AAACTAGGAT AAATTATCGC GCGCGGTGTC ATCTATGTTA CTAGATCGAA 
2761 TT / CGATCGAG GGGATCGAGC CCCTGCTGAG CCTCGACATG TTGTCGCAAA ATTCGCCCTG 
2821 GACCCGCCCA ACGATTTGTC GTCACTGTCA AGGTTTGACC TGCACTTCAT TTGGGGCCCA 
2881 CATACACCAA AAAAATGCTG CATAATTCTC GGGGCAGCAA GTCGGTTACC CGGCCGCCGT 
2941 GCTGGACCGG GTTGAATGGT GCCCGTAACT TTCGGTAGAG CGGACGGCCA ATACTCAACT 
3001 TCAAGGAATC TCACCCATGC GCGCCGGCGG GGAACCGGAG TTCCCTTCAG TGAACGTTAT 
3061 TAGTTCGCCG CTCGGTGTGT CGTAGATACT AGCCCCTGGG GCCTTTTGAA ATTTGAATAA 
'3121 GATTTATGTA ATCAGTCTTT TAGGTTTGAC CGGTTCTGCC GCTTTTTTTA AAATTGGATT 
3181 TGTAATAATA AAACGCAATT GTTTGTTATT GTGGCGCTCT ATCATAGATG TCGCTATAAA 
3241 CCTATTCAGC ACAATATATT GTTTTCATTT TAATATTGTA CATATAAGTA GTAGGGTACA 
3301 ATCAGTAAAT TGAACGGAGA ATATTA1TCA TAAAAATACG ATAGTAACGG GTGATATATT 
3361 CATTAGAATG AACCGAAACC GGCGGTAAGG ATCTGAGCTA CACATGCTCA GGTTTTTTAC 
3421 AACGTGCACA ACAGAATTCA AAGCAAATAT CATGCGATCA TAGGCGTCTC GCATATCTCA 
3481 TTAAAGCAGG GGGTGGGCGA AGAACTCCAG CATGAGATCC CCGCGCTGGA GGATCATCCA 
3541 GCCGGCGTCC CGGAAAACGA TTCCGAAGCC CAACCTITCA TAGAAGGCGG CGGTGGAATC 
3601 GAAATCTCGT GATGGCAGGT TGGGCGTCGC TTGGTCGGTC ATTTCGAACC CCAGAGTCCC 
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3661 GCTCAGAAGA ACTCGTCAAG AAGGCGATAG AAGGCGATGC GCTGCGAATC GGGAGCGGCG 
3721 ATACCGTAAA GCACGAGGAA GCGGTCAGCC CATTCGCCGC CAAGCTCTTC AGCAATATCA 
3781 CGGGTAGCCA ACGCTATGTC CTGATAGCGG TCCGCCACAC CCAGCCGGCC ACAGTCGATG 
3841 AATCCAGAAA AGCGGCCATT TTCCACCATG ATATTCGGCA AGCAGGCATC GCCATGGGTC 
3301 ACGACGAGAT CCTCGCCGTC GGGCATGCGC GCCTTGAGCC TGGCGAACAG TTCGGCTGGC 
3961 GCGAGCCCCT GATGCTCTTC GTCCAGATCA TCCTGATCGA CAAGACCGGC TTCCATCCGA 
4021 GTACGTGCTC GCTCGATGCG ATGTTTCGCT TGGTGGTCGA ATGGGCAGGT AGCCGGATCA 
4081 AGCGTATGCA GCCGCCGCAT TGCATCAGCC ATGATGGATA CITTCTCGGC AGGAGCAAGG 
4141 TGAGATGACA GGAGATCCTG CCCCGGCACT TCGCCCAATA GCAGCCAGTC CCTTCCCGCT 
till SgS CGTCGAGCAC AGCTGCGCAA GGAACGCCCG TCGTCGCCAG CCACGATAGC 
& 2 61 CGCGCTGCCT CGTCCTGCAG TTCATTCAGG GCACCGGACA GGTCGGTCTT GACAAAAAGA 
till cSScGCTGA CAGCCGGAAC ACGGCGGCAT CAGAGCAGCC GA1TGTCTGT 

4381 TGTGCCCAGT CATAGCCGAA TAGCCTCTCC ACCCAAGCGG CCGGAGAACC TGCGTGCAAT 
4441 CCATCTTGTT CAATCCACAT GATCATGGGC CGGATCTTTG ATTG AGAGTG AATATCAGAC 
till SSS TACCGAGGGG AATTTATGGA ACGTCAGTGG AGCATTCTTG ACAAGAAATA 
4561 TITGCTAGCT GATAGTGACC TTAGGCGACT TTTGAACGCG CAATAATGGT TTCTCACGTA 
ACL->S TY-TCCTTAGC TCATTAAACT CCAGAAACCC GCGGCTGAGT GGCTCCTTCA ATCGTTGCGG 
till SSSSS AAACGGCTIG ^CCGCGTCA TOGGCGGGGG TCATAACGTG 

4741 ACTCCCTTAA TICTCCGCTC ATGATCCTGT TTCCTGTGTG AAATTGTTAT CCGCTCACAA 
ilol ScAcIcAT TATACGAGCC GGAAGCATAA AGTGTAAAGC CTGGSGTGCC TAATGAGTGA 
... OTiifTOir ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTCGGGA AACCTGTCGT 

4921 SSgcSc5 StSatc ggaattcacg gatctcctit GCCCCGGAGA tcaccatgga 
till Sc^SSc" StSSacg atctaggaag aaagttcgac ggagaaggtg acgataccat 

5041 GTTCACCACC GATAATGAGA AGATTAGCCT CTTCAATTTC AGAAAGAATG CTGACCCACA 
ilSl GATGGTTAGA GAGGCCTACG CGGCAGGTCT CATCAAGACG ATCTACCCGA GTAATAATCT 
=n fil rVAGGAGATC AAATACCTTC CCAAGAAGGT TAAAGATGCA GTCAAAAGAT TCAGGACTAA 

till aSSS aagatatatt tctcaagatc agaag^cta ^cag^tg 

5281 GACGATTCAA GGCTTGCTTC ATAAACCAAG GCAAGTAATA GAGATTCGAG TCOTAAGAA 
5341 AGTAGTTCCT ACTGAATCAA AGGCCATGGA GTCAAAAATT CAGATCGAGG ATCTAACAGA 
5401 ACTCGCCGTG AAGACTGGCG AACAGTTCAT ACAGAGTCTT TTACGACTCA ATCACAAGAA 
5461 GAAAATCTTC GTCAACATCG TGGAGCACGA CACTCTCGTC TACTCCAAGA ATATCAAAGA 
till SSg^SS GAAGACCAAA GGGCTATIGA GACTTITCAA caaagggtaa TATCGGGAAA 
5581 CCTCCTCGGA T?CCATIGCC CAGCTATCTG TCACTTCATC AAAAGGACAG TAGAAAAGGA 

till aSScaIc tacaaaigcc atcattgcga taaaggaaag gctatcgttc aagatgcctc 

5701 TGCCGACAGT GGTCCCAAAG ATGGACCCCC ACCCACGAGG AGCATCGTGG AAAAAGAAGA 
5761 CGTTCCAACC ACGTCTTCAA AGCAAGTGGA TTGATGTGAT ATCTCCACTG ACGTAAGGGA 
SR31 TCACGCACAA TCCCACTATC CTTCGCAAGA CCCTTCCTCT ATATAAGGAA GTTCATTTCA 
till SS SaSSSS ATCACCAGTC TCICTCTACA AATCGGATCC atgagcccag 

5941 aacgacgccc ggccgacatc cgccgtgcca ccgaggcgga catgccggcg gtctgcacca 

6001 TCGTCAACCA CTACATCGAG ACAAGCACGG TCAACITCCG TACCGAGCCG CAGGAACCGC 
6061 AGGAGTGGAC GGACGACCTC GTCCGTCTGC GGGAGCGCTA TCCCTGGCTC G^^SAGG 
6121 TGGACGGCGA GGTCGCCGGC ATCGCCTACG CGGGCCCCTG GAAGGCACGC AACGCCTACG 

6181 aEtggacggc cgagtcgacc gtgtacgtct ccccccgcca ccagcggacg ggactgggct 

6241 CCACGCTCTA CACCCACCTG CTGAAGTCCC TGGAGGCACA GGGCTTCAAG AGCGTGGTCG 
till cSScSSS SCCCAAC GACCCGAGCG TGCGCATGCA CGAGGCGCTC GGATATOCCC 
filfil CCCGCGGCAT GCTGCGGGCG GCCGGCTTCA AGCACGGGAA CTGGCATGAC GTGGGTTTCTI 
I2S SS?GGA CTTCAGCCTC CCGGTACCGC CCCGTCCGGT CCTGCCCGTC ACCGAGATCT 

till gtcSggatc CGATGGATCC cccgatcagc taagctagct atatcatgaa 

ttll ?Sg^S AcSS^S TCGCACIGAG TCTTIGATCT ACGGCAATGT ACCAGCTGg 
6601 ATAATCAGTT ATTGAAATAT TTCTGAATTT AAACTTGCAT CAATAAATTT ATCTTOGC 

till SSSS aSS^ct igtzattita tcaataaata t^aaactat atitottca 

6721 AGATGGGAAT TAACATCTAC AAATTGCCIT TTCOTATCGA CCATGTACAT CAAGCmTC 
6781 GATACCGTCG GCTATTGGTA ATAGGACACT GGGATTCGTC TIGGACAACT TT^TCTCA 
6841 TCTAAGCGTA GACAACCCIC AACTGGAAAC GGGCCGGACT CCAGGGCGTG TGCCAGGTGC 
6901 CCACGGAATA GTTTTGGCCA GACCCITGAA AATCCGATTC AGTACAATCG ATTGCCCTCA 
"si S^ScGlT SmiC CTGCCAAACA GCCAACAACG CGCGTGCGGT GAATAGGAAA 
loll GCGTOGAGT TGCTTGCTCA TATCGTGACG GTTGACAGCA CAGGTIGACC GCTT3ATGAT 
7081 TCGTACGAGC CGCCAAACAT TGGCTGTCGT AATGATATAC CATGTCAGAA CAGCAATCCG 

illl SSSgS aagcattatc ttaatgcaca cggaaatggc gcgtcggtgg gtggaataca 
7201 ccgacataga ggccgtaagt tctgcatggt catcgtcgga aaggtggcag caggcgcacg 

7261 GCTGTGGCCT cnGCIOTIT CAGCGTGAAA TGCGTGTTGA AAGAATAATC GAAGAGAGCG 
7321 ?CCGC?CGAC ACCTTCAATT ATGCCGATTT GATCGATGAA CTGATCGAGC TCTGAAATCG 
7381 AAGGGGCTTC GATAATCGCA ATCAAATCAA AAGTGCCACT CACAGAATGA AGAGCGATAA 
7441 CGGCCGTCAC CTTCCCAAGG GAGGCCGTCA CCTGTGAAAG CGCCTTCGTA ATGGTGATCA 
7501 GAATATGGGC TCGAACCAAG CTCGAGACCT CGAGGGGGGG CCCGGTACCC AATTCGCCCT 
7561 ATAGTGAGTC GTATTACAAT TCACTGGCCG TCGTTTTAC 
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kanamycin (R) pBR322 ori 
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<400> 1 

gtcgaattgt gatacattgt aagcaatctg aaaagaataa gtgggatata taaacaaccg 60 

gcgaaagtac aagttctacc tttttttggc atggaaccat gtttttagga tttactttgt 120 

aattcctgaa tctttcattt cttgaattga tatttacatt tttatcaaaa aaaaagtaca 180 

agttctacca aagcacagga gttaaacaac ttgtgtgtca aatgctaatt taaagcctaa 240 

tcttatgatt tcccttttct tcacgatata tactgatatt gatatgcacc catttgtttg 300 

tcattaactt cccactctat acatcagtat ctcaaagtcg aataacaata tccataagaa 3 60 

gtggtatatt gtgaaaaaaa aaaaaaaaag tggtatactg gtatatacaa taccacggtc 42 0 

tcgaattgcc tcaacaattt ctaggagaaa atggacgtgt ctctttggtt ttattttatt 480 

cttaataaca tactctatat tttaaacact tcgatgtctc gcttaaattt cgaatgtgcc 540 

taaatttctc taatcataaa tcgtaaagaa aattcgtcga agccacaggg acatgcatag 600 

ggcacgtagt tacctttaaa accatcaaaa atatattaat agaaaaggaa acttcctaaa 66 0 
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agaacaattt aataaagtgg ataaaaaaag 
ccgcgactcg taacaaggga cgtcccgacc 
ttttcttttt cttttcctaa agaacgttgt 
aattgttctg cctattatta tataactaaa 
gatatataat ctaacttaaa ttagttctaa 
acctcagtcc ctagttagct atatggacat 
ttcctcttcc tgcaactaac tcttatctta 
ggcactctcg tattaaatat gccagttgca 
tttaaaactt gaaatgttat ttgaactctt 
ttttgaagat atttatatat tgaagatgtt 
tattgatgta gatgttgtcc ttttgtagtt 
catcctccta tgaagaaaaa tccaaatagt 
ttttcgtaac cacagttcta tgtagctatc 
aagatcgttt ttgtaaaatt cagtagggca 
tctagcgttc tgtcatccac aaataagttg 
ttttagatgg gtcatgaaga tttctaactt 
catatacgtc ttgtttttgg taggctctgc 
ttgttgcacc ttagacaatc cataatacgt 
caaatataat ttaaatttgg ccacaaaaca 
atcgtttcaa attttattta ttcaatggcg 
ctcactgacg aattttttaa tttttcaaag 
tggaaccacc ggttaagctc gatgattttg 
taacgaccta catttgatcc ctcactactt 
gttcaccaaa gacgtctctt atggctatta 
taagacgtct tatattcaac cattactcca 
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ataagaaggt aggcagaaga aaacgtatgg 72 0 
actgcggaga cggcgagacg ctgactgatt 780 
ttcgtgctta caagggtcaa aaccatatcc 840 
gatcccctct tgtgctttgt ctttattcgt 900 
aatatatatg tcctacctat gtttctactg 960 
atgtgaaaat gacgcccaaa atttgaagag 102 0 
ctcattgagc tatgttaaat attgaatgtt 1080 
cctagataaa aaaacatgat agacatttag 1140 
tggattacgt ggattgttgt atggattaaa 12 00 
tatatatatt agagtttata tagcagaaaa 1260 
actctttttt gttgcgtagt cctttctcct 1320 
ttaaggaaat ttttgtgtaa ttcatagtct 1380 
gtcatcatat tcctctttgc aacaacaaaa 1440 
ccaaagtcgt catttgttgt cctgtcgaaa 1500 
tttgattcga gcttccaaga ttataatctt 1560 
cgtatacgag tgtatccata taatttctaa 1620 
gtcttttgag accaccccct tgctaatgtt 1680 
tacgtgagtc gaagttgcac caaaatggtc 1740 
acattttaca aacaaattca acaaacatgc 1800 
ttatttgttc attgtaaata ttctgtttaa 1860 
aagaacattt ttgatataaa taacatttta 1920 
agttttagtf ttgtcgtttt gtgaaatcat 1980 
taataattag gaatcaaaca tgatgattaa 2040 
agagtcagac gcaaggatga ccggggtcat 210 0 
ctaattgcta attaatcag 2149 
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<400> 2 



gtcgaattgt 


ganatattgt 


aagcaatctg 


aaaagaataa 


gtgggatata 


taaacaaccg 


60 


gcgaaagtac 


aagttctacc 


tttttttggc 


atggaaccat 


gtttttagga 


tttactttgt 


120 


aattcctgaa 


tctttcattt 


cttgaattga 


tatttacatt 


tttatcaaaa 


aaaaagtaca 


180 


agttctacca 


aagcacagga 


gttaaacaac 


ttgtgtgtca 


aatgetaatt 


taaagcctaa 


240 


tcttatgatt 


tcccttttct 


tcacgatata 


tactgatatt 


gatatgeace 


catttgtttg 


300 


tcattaacnt 


cccactctat 


acatcagcat 


ctcaaagtcg 


aataacaata 


tccataagaa 


360 


gtggtatatt 


gtgaaaaaaa 


aaaaaaaaag 


tggtatactg 


gtatatacaa 


taccacggtc 


420 


tcgaattgcc 


tcaacaattt 


ctaggagaaa 


atggacgtgt 


ctctttggtt 


ttattttatt 


480 


cttaataaca 


tactctatat 


tttaaacact 


tcgatgtctc 


gcttaaattt 


cgaatgtgcc 


540 


taaatttctc 


taatcataaa 


tcgtaaagaa 


aattcgtcga 


agecacaggg 


acatgeatag 


600 


ggcacgtagt 


tacctttaaa 


accatcaaaa 


atatattaat 


agaaaaggaa 


acttcctaaa 


660 


agaacaattt 


aataaagtgg 


ataaaaaaag 


ataagaaggt 


aggcagaaga 


aaacgtatgg 


720 


ccgcgactcg 


taacaaggga 


cgtcccgacc 


actgcggaga 


eggegagacg 


ctgactgatt 


780 


ttttcctttt 


cttttcctaa 


agaacgttgt 


ttcgtgctta 


caagggtcaa 


aaccatatcc 


840 


aattgttctg 


cctattatta 


tataaccaaa 


gatcccctct 


tgtgctttgt 


ecttattegt 


900 


gatatataat 


ctaacttaaa 


ttagttctaa 


aatatatatg 


tcctacctat 


gtttctactg 


960 


acctcagtcc 


ctagttagct 


acatggacat 


atgtgaaaat 


gacgcccaaa 


atttgaagag 


1020 


ttcctcttcc 


tgcaactaac 


tcttatctta 


ctcattgagc 


tatgttaaat 


attgaatgtt 


1080 


ggcactctcg 


tattaaatat 


gccagttgca 


cctagataaa 


aaaacatgat 


agacatttag 


1140 


tttaaaactt 


gaaatgttat 


ttgaaccctt 


tggattacgt 


ggattgttgt 


atggattaaa 


1200 


ttttgaagat 


atttatatat 


t:gaagatgt:t 


tatatatatt 


agagtttata 


tagcagaaaa 


1260 


tattgatgta 


gatgttgtcc 


ttttgtagtt 


actctttttt 


gttgcgtagt 


cctttctcct 


1320 


catcctccta 


tgaagaaaaa 


tccaaatagt 


ttaaggaaat 


ttttgtgtaa 


ttcatagtct 


1380 


ttttcgtaac 


cacagttcta 


tgtagctatc 


gtcatcatat 


tcctctttgc 


aacaacaaaa 


1440 


aagatcgttt 


ttgtaaaatt 


t. acr t aqq a c a 


c t aaacrt cert: 


catttCTttati 

w» M w W w >M W w *J l*> 


cctcrt coaaa 


1500 

J- -mJ W \g/ 


tctagcgttc 


tgtcatccac 


aaataagttg 


tttgattcga 


gcttccaaga 


ttataatctt 


1560 


ttttagatgg 


gtcatgaaga 


tttctaactt 


cgtatacgag 


tgtatccata 


taatttctaa 


1620 


catatacgtc 


ttgtttttgg 


taggctctgc 


gtcttttgag 


accaccccct 


tgctaatgtt 


1680 


ctgttgcacc 


ttagacaatc 


cataatacgt 


tacgtgagtc 


gaagttgcac 


caaaatggtc 


1740 


caaatataat 


ttaaatttgg 


ccacaaaaca 


acattttaca 


aacaaattca 


acaaacatgc 


1800 


atcgtttcaa 


attttattta 


ttcaatggcg 


ttatttgttc 


attgtaaata 


ttctgtttaa 


1860 


ctcactgacg 


aattttttaa 


tttttcaaag 


aagaacattt 


ttgatataaa 


taacatttta 


1920 
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tggaaccacc ggttaagccc gatgattttg agttttagtt ttgtcgtttt gtgaaatcat 1980 
taacgaccta catttgatcc ctcattactt taataattag gaatcaaaca tgatgattaa 2040 
gttcaccaaa gacgtctctt atggctatta agagtcagac gcaaggatga ccggggtcat 210 0 
taagacgtct tatattcaac cattactcca ctaattgcta attaatcagt cccttatgtt 2160 
acgtcctgta gaaaccccaa cccgtgaaat caaaaaactc gacggcctgt gggcattcag 2220 
tctggatcgc gaaaactgrg gaattgatca gcgttggtgg gaaagcgcgt tacaagaaag 22 8 0 
ccgggcaatt gctgtgccag gcagttttaa cgatcagttc gccgatgcag atattcgtaa 2340 
ttatgcgggc aacgtctggt atcagcgcga agtctttata ccgaaaggtt gggcaggcca 2400 
gcgtatcgtg ctgcgtttcg atgcggtcac tcattacggc aaagtgtggg tcaataatca 2460 
ggaagtgatg gagcatcagg gcggctatac gccatttgaa gccgatgtca cgccgtatgt 2 52 0 
tattgccggg aaaagtgtac gtatcaccgt ttgtgtgaac aacgaactga actggcagac 258 0 
tatcccgccg ggaatggtga ttaccgacga aaacggcaag aaaaagcagt cttacttcca 2640 
tgatttcttt aactatgccg gaatccatcg cagcgtaatg ctctacacca cgccgaacac 2700 
ctgggtggac gatatcaccg tggtgacgca tgtcgcgcaa gactgtaacc acgcgtctgt 2760 " 
tgactggcag gtggtggcca atggtgatgt cagcgttgaa ctgcgtgatg cggatcaaca 2 82 0 
ggtggttgca actggacaag gcactagcgg gactttgcaa gtggtgaatc cgcacctctg 2880 
gcaaccgggt gaaggtcatc tctatgaact gtgcgtcaca gccaaaagcc agacagagtg 2 940 
tgatatctac ccgcttcgcg tcggcatccg gtcagtggca gtgaagggcc aacagttcct 3000 
gattaaccac aaaccgttct actttactgg ctttggtcgt catgaagatg cggacttacg 3 060 
tggcaaagga ttcgataacg tgctgatggt gcacgaccac gcattaatgg actggattgg 3120 
ggccaactcc Caccgtacct cgcactaccc ttacgctgaa gagacgctcg actgggcaga 318 0 
tgaacatggc accgtggtga ttgatgaaac tgctgctgtc ggctttaacc tctctttagg 3240 
cattggtttc gaagcgggca acaagccgaa agaactgtac agcgaagagg cagtcaacgg 33 0 0 
ggaaacccag caagcgcact tacaggcgat taaagagctg atagcgcgtg acaaaaacca 3360 
cccaagcgtg gtgatgtgga gtatcgccaa cgaaccggat acccgtccgc aagtgcacgg 342 0 
gaatatttcg ccactggcgg aagcaacgcg taaactcgac ccgacgcgtc cgatcacctg 34 8 0 
cgtcaatgta atgttctgcg acgctcacac cgataccatc agcgatctct ttgatgtgct 3540 
gtgcctgaac cgttattacg gatggtatgt ccaaagcggc gatctggaaa cggcagagaa 3 600 
ggtactggaa aaagaacttc tggcctggca ggagaaactg catcagccga ttatcatcac 3660 
cgaatacggc gtggatacgt tagccgggcc gcactcaatg tacaccgaca tgtggagtga 3 72 0 
agagtatcag tgtgcatggc tggatatgta tcaccgcgtc tttgatcgcg tcagcgccgt 3780 
cgtcggtgaa caggtatgga atttcgccga ttttgcgacc tcgcaaggca tattgcgcgt 3840 
tggcggtaac aagaaaggga tcttcactcg cgaccgcaaa ccgaagtcgg cggcttttct 3900 
gctgcaaaaa cgctggactg gcatgaactt cggcgaaaaa ccgcagcagg gaggcaaaca 3 960 
atgaatcaac aactctcctg gcgcaccatc gtcggctaca gcctcggtgg ggaattgagc 4020 
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tcgatcgttc aaacatttgg 
cgatgattat catataattt 
gcatgacgtt attcatgaga 
acgcgataga aaacaaaata 
ctatgttact agatcgaatt 



5 

caataaagtt tcttaagatt 
ctgttgaatt acgttaagca 
tgggttttta tgattagagt 
tagcgcgcaa actaggataa 
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gaatcctgtt gccggtcttg 4080 
tgtaataatt aacatgtaat 4140 
cccgcaatta tacatttaat 4200 
actatcgcgc gcggtgtcat 4260 

4280 



<210> 3 
<21I> 4413 
<212> ADN 

<213> Arabiciopsis thaliana 



<400> 3 



aagatccaca 


gtgaataaat 


aataagaacg 


gattcggtga 


tattgcaact 


atataatgaa 


60 


attgaatact 


ctgattcatc 


gctttgtatc 


aagatcgaat 


ctctaaaaac 


atatactcta 


120 


taataaatat 


ctgcagtcga 


attgtgatat 


attgtaagca 


atctgaaaag 


aataagtggg 


180 


atatataaac 


aaccggcgaa 


agtacaagtt 


ctaccttttt 


ttggcatgga 


accatgtttt 


240 


taggatttac 


tttgtaattc 


ctgaatcttt 


catttcttga 


attgatattt 


acatttttat 


300 


caaaaaaaaa 


gtacaagtt c 


taccaaagca 


caggagttaa 


acaacttgtg 


tgtcaaatgc 


360 


taatttaaag 


cctaatctta 


tgatttccct 


tttcttcacg 


atatatactg 


atattgatat 


420 


gcacccattt 


gtttgtcatt 


aacttcccac 


tctatacatc 


agtatctcaa 


agtcgaataa 


480 


caatat ccat 


aagaagtggc 


atattgtgaa 


aaaaaaaaaa 


aaaagtggta 


tactggtata 


540 


tacaatacca 


cggtctcgaa 


ttgcctcaac 


aatttctagg 


agaaaatgga 


cgtgtctctt 


600 


tggttttatt 


ttattcttaa 


caacatactc 


tatattttaa 


acacttcgat 


gtctcgctta 


660 


aatttcgaat 


gtgcctaaat 


ttctctaatc 


ataaatcgta 


aagaaaattc 


gccgaagcca 


720 


cagggacatg 


catagggcac 


gtagttacct 


ttaaaaccat 


caaaaatata 


ttaatagaaa 


780 


aggaaacttc 


ctaaaagaac 


aatttaataa 


agtggataaa 


aaaagataag 


aaggtaggca 


840 


gaagaaaacg 


tatggccgcg 


actcgtaaca 


agggacgtcc 


cgaccactgc 


ggagacggcg 


900 


agacgctgac 


tgattttttc 


tttttctttt 


cctaaagaac 


gttgtttcgt 


gcttacaagg 


960 


gtcaaaacca 


tatccaattg 


ttctgcctat 


tattatataa 


ctaaagatcc 


cctcttgtgc 


1020 


tttgtcttta 


ttcgtgatat 


ataatctaac 


ttaaattagt 


tctaaaatat 


atatgtccta 


1080 


cctatgtttc 


tactgacctc 


agtcccnagc 


tagctatatg 


gacatatgtg 


aaaatgacgc 


1140 


ccaaaatttg 


aagagttcct 


cttcctgcaa 


ctaactctta 


tcttactcat 


tgagctatgt 


1200 


taaatattga 


atgctggcac 


tctcgtatta 


aatatgccag 


ttgcacctag 


ataaaaaaac 


1260 


atgatagaca 


tttagtttaa 


aacttgaaat 


gttatttgaa 


ctctttggat 


tacgtggatt 


1320 
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gttgtatgga ttaaattttg aagatattta 
ttatatagca gaaaatattg atgtagatgt 
gtagtccttt ctcctcatcc tcctatgaag 
tgtaattcat agtctttttc gtaaccacag 
tttgcaacaa caaaaaagat cgtttttgta 
gttgtcctgt cgaaatctag cgttctgtca 
caagattata atctttttta gatgggtcat 
ccatataatt tctaacatat acgtcttgtt 
ccccttgcta atgttttgtt gcaccttaga 
tgcaccaaaa tggtccaaat ataatttaaa 
attcaacaaa catgcatcgt ttcaaatttt 
aaatattctg tttaactcac tgacgaattt 
ataaataaca ttttatggaa ccaccggtta 
gttttgtgaa atcattaacg acctacattt 
aaacatgatg attaagttca ccaaagacgt 
gatgaccggg gtcattaaga cgtcttatat 
tcagattaat ttgtttaata cgataatgta 
aaaggataaa ttttggatta ttcaaagatt 
ccaactacat tgggaaatat attatttaaa 
gtttattttt tttttccaag tggaagaatc 
cttgttggaa aacaaaccca agcaaaatta 
attatactaa acatatcaat atagctttga 
ttagttagat attttaccag gggaaataag 
actatacttt gaaagaactt atatgtcact 
acatttcact tgttgacatc gctgtaaacg 
agggttaatt aaccactaaa tttttccaag 
atctaatacg tcggtctaac ctaagagttg 
ttcaataaaa aatttgttgt tataatttca 
attttctatt tgatgtgaat ttgaaaatgt 
taattaatat agaccacaga tacaaaaaga 
tcgtaccctt ttgccaactt tttcaagttt 
taaattgaca gatgattgtt gcatgcatat 
aaccaaataa tgggtaatgg atataaaata 
aaaaatagag agtaaattga ttttttttaa 
ataaaaataa taaacctgta gtttgatata 
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tatattgaag atgtttatat atattagagt 1380 
tgtccttttg tagttactct tttttgttgc 1440 
aaaaatccaa atagtttaag gaaatttttg 1500 
ttctatgtag ctatcgtcat catattcctc 1560 
aaatttagta gggcactaaa gtcgtcattt 1620 
tccacaaata agttgtttga ttcgagcttc 1680 
gaagatttct aacttcgtat acgagtgtat 1740 
tttggtaggc tctgcgtctt ttgagaccac 1800 
caatccataa tacgttacgt gagtcgaagt I860 
tttggccaca aaacaacatt ttacaaacaa 1920 
atttattcaa tggcgttatt tgttcattgt 1980 
tttaattttt caaagaagaa catttttgat 2040 
agctcgatga -ttttgagttt tagttttgtc 2100 
gatccctcat tactttaata attaggaatc 2160 
ctctcatggc tattaagagt cagacgcaag 2220 
tcaaccatta ctccactaat tgctaattaa 2280 
ttttgattaa gtagctctca gccaacaggc 2340 
tgtgggcttc caaaagcata gggaatggct 2400 
tctccattcc catttgccac agtcgttgga 2460 
aattataatt gtcggaattt ctaaatccta 2520 
gtttagaaat gtacggaaat ctactataga 2580 
ctttaaaatt aaaacaatta ttgtgggcaa 2640 
cagcactgtt catgcactct cttcttaatt 2700 
gtattgccag ttgccactaa tatataaaca 2760 
aagtttggaa cgaccctctt aacaactaat 2820 
ttgtcatttt gtcttaatgt gagacgtaat 2880 
gttccgatca caaatttttg agaagtacct 2940 
ccgtgttaag taaaaactta attaggagct 3 000 
cttcataaaa atagtatgga aaagggaatg 3060 
tgtcccgtgc ttaacacgtc tgagtcattg 3120 
ctttcgtgaa aatgactaca ctttttaaaa 3180 
aatattcgca aaatgccaaa ttctaccctt 3240 
gttaacataa acaaaaattt ggaaattttg 3300 
aaagtttgaa ttgaagtgaa aaaatatata 33 60 
tatagttaga tagctcaagt ttgagtaact 3420 
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tgaagtcttg 


aattacttta 


tatgtttttc 


7 

tcacagatta 


tattattttc 


« 

gttctatccc 


r 

• 

3480 


aagaattggg 


ataatattct 


ctatattcga 


ggcctctctc 


ttaagaagtc 


ggtgtataat 


3540 


cttaagccct 


tacttgacac 


aaggcctcta 


ctaaaaagcc 


caataataat 


ttttcttttc 


3600 


aa aarrnrra a r-« 


S t~~> +~ r" a a rr-i r- *■ 






uuL.yyaui-.yct. 


ctcuauiy Lyyuy 


J o o u 


ggcggttgga 


aactgaatct 


taaacccttc 


actcacattc 


atcttcaccg 


tcaaatctct 


3720 


gaaactgagc 


ttcgacgatg 


ttgggtttac 


gaagatctgc 


gacgaccttg 


ttcgacatca 


3780 


gccagtctct 


gcttcgtaat 


gttacggtta 


gtatctgtct 


aacacttcag 


cgccacattt 


3840 


gggttttacg 


attagggttt 


caacagatcg 


aatcgattca 


tctctcttgg 


tattagattt 


3900 


catcaaattc 


aaatctatcg 


tcacctaaaa 


atctctcttt 


cggtatgtag 


tatttccggg 


3960 


gttgtttcaa 


agtcgtctta 


ttgctctgtg 


attttggctt 


cttacccatt 


ttcaacagtg 


4020 


ctatgtagaa 


gaaagaacaa 


atctttgaaa 


tcgaaaggtc 


taatgtatag 


ttcaatgtct 


4080 


acattatgag 


attgccatga 


tattatagtc 


aaacgattct 


cctaaagcgt 


ttactttt.gt 


4140 


ggagcattct 


ttgttagttc 


tatgcaaata 


aagttctagg 


aatgataatt 


cttaaggaag 


4200 


catctcaaat 


gttggctagt 


tcttgtctca 


ggttaaaaca 


atgttttgca 


atttgctttt 


4260 


agttagaatt 


gttgacttgc 


ttagcttttt 


gactaactct 


gtctctgtga 


agcaaagttt 


4320 


gatcaaaccc 


attaccttat 


ttgatttctc 


tctttagatt 


atacatcaat 


ttatgtattt 


4380 


tctttgtcta 


cagtttcatg 


qcrt taccracrt 


cca 






4413 


<210> 4 














<211> 4309 














<212> ADN 






* 








<213> Sequence artif icielle 










<220> 














<223> Description de la sequence 


artif icielle : Insert du 




vecteur pBinl9 












<400> 4 














tctagaacta 


gtggatcccc 


cgggctgcag 


tcgaattgtg 


atatattgta 


agcaatctga 


60 


aaagaataag 


^gggatatat 


aaacaaccgg 


cgaaagtaca 


agttctacct 


ttctttggca 


120 


tggaaccatg 


tttttaggac 


ttactttgta 


attcctgaat 


ctttcatttc 


ttgaattgat 


inn 


atttacattt 


ttatcaaaaa 


aaaagtacaa 


gttctaccaa 


agcacaggag 


ttaaacaact 


240 


tgtgtgtcaa 


atgctaattt 


aaagcctaat 


cttatgattt 


cccttttctt 


cacgatatat 


300 


actgatattg 


atatgcaccc 


atttgtttgt 


cattaacttc 


ccactctata 


catcagtatc 


360 
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tcaaagtcga ataacaacat ccacaagaag tggtatattg tgaaaaaaaa aaaaaaaagt 42 0 
ggtatactgg tatatacaat accacggtct cgaattgcct caacaatttc taggagaaaa 480 
tggacgtgtc tctttggttt tattttattc ttaataacat actctatatt ttaaacactt 540 
cgatgtctcg cttaaatttc gaatgtgcct aaatttctct aatcataaat cgtaaagaaa 600 
attcgtcgaa gccacaggga catgcatagg gcacgtagtt acctttaaaa ccatcaaaaa 660 
tatattaata gaaaaggaaa cttcctaaaa gaacaattta ataaagtgga taaaaaaaga 720 
taagaaggta ggcagaagaa aacgtatggc cgcgactcgt aacaagggac gtcccgacca 78 0 
ctgcggagac ggcgagacgc tgactgattt tttctttttc ttttcctaaa gaacgttgtt 840 
tcgtgcttac aagggtcaaa accatatcca attgtnctgc ctattattat ataactaaag 900 
atcccctctt gtgctttgtc tttattcgtg atatataatc taacttaaat tagttctaaa 960 
atatatatgt cctacctatg ttt'ctactga cctcagtccc tagttagcta tatggacata 1020 
tgtgaaaatg acgcccaaaa tttgaagagt tcctcttcct gcaactaact cttatcttac 1080 
tcattgagct atgttaaata ttgaatgttg gcactctcgt attaaatatg ccagttgcac 1140 
ctagataaaa aaacatgaca gacatttagt ttaaaacttg aaatgttatt tgaactcttt 1200 
ggattacgtg gattgttgta tggattaaat tttgaagata tttatatatt gaagatgttt 126 0 
atatatatta gagnttanat agcagaaaat attgatgtag atgttgtcct tttgtagtta 132 0 
ctcttttttg ttgcgtagtc ctttctcctc atcctcctat gaagaaaaat ccaaatagtt 1380 
taaggaaatt tttgtgtaat tcatagtctt tttcgtaacc acagttctat gtagctatcg 1440 
tcatcatatt cctctttgca acaacaaaaa agatcgtttt tgtaaaattt agtagggcac 1500 
taaagtcgtc atttgttgtc ctgtcgaaat ctagcgttct gtcatccaca aataagttgt 1560 
ttgattcgag cttccaagat tataatcttt tttagatggg tcatgaagat ttctaacttc 1620 
gtatacgagt gtatccatat aatttctaac atatacgtct tgtttttggt aggctctgcg 1680 
tcttttgaga ccaccccctt gctaatgttt tgttgcacct tagacaatcc ataatacgtt 1740 
acgtgagtcg aagttgcacc aaaatggtcc aaatataatt taaatttggc cacaaaacaa 1800 
cattttacaa acaaattcaa caaacatgca tcgtttcaaa ttttatttat tcaatggcgt 1860 
tatttgttca ttgtaaatat tctgtttaac tcactgacga attttttaat ttttcaaaga 1920 
agaacatttt tgatataaat aacattttat ggaaccaccg gttaagctcg atgattttga 1980 
gttttagttt tgtcgttttg tgaaatcatt aacgacctac atttgatccc tcattacttt 2040 
aataattagg aatcaaacat gatgattaag ttcaccaaag acgtctctta tggctattaa 2100 
gagtcagacg caaggatgac cggggtcatt aagacgtctt atattcaacc attactccac 2160 
taattgctaa ttaatcagtc ccttatgtta cgtcctgtag aaaccccaac ccgtgaaatc 2220 
aaaaaactcg acggcctgtg ggcattcagt ccggatcgcg aaaactgtgg aattgatcag 2280 
cgttggtggg aaagcgcgtt acaagaaagc cgggcaattg ctgtgccagg cagttttaac 2340 
gatcagttcg ccgatgcaga tattcgtaat tatgcgggca acgtctggta tcagcgcgaa 2400 
gtctttatac cgaaaggttg ggcaggccag cgtatcgtgc tgcgtttcga tgcggtcacc 2460 
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catcacggca aagtgtgggt caataatcag gaagtgatgg agcatcaggg cggctatacg 2 52 0 
ccatttgaag ccgatgtcac gccgtatgtt attgccggga aaagtgtacg tatcaccgtt 2580 
tgtgtgaaca acgaactgaa ctggcagact accccgccgg gaatggcgat taccgacgaa 2 64 0 
aacggcaaga aaaagcagtc ttacttccat gatttcttta actacgccgg aatccatcgc 2700 
agcgtaatgc tctacaccac gccgaacacc tgggtggacg atatcaccgt ggtgacgcat 2760 
gtcgcgcaag actgtaacca cgcgtctgtt gactggcagg tggtggccaa tggtgatgtc 2 82 0 
agcgttgaac tgcgtgatgc ggatcaacag gtggttgcaa ctggacaagg cactagcggg 2880 
actttgcaag tggtgaatcc gcacctctgg caaccgggtg aaggttatct ctatgaactg 2940 
tgcgtcacag ccaaaagcca gacagagtgt gatatctacc cgcttcgcgt cggcatccgg 3000 
tcagtggcag tgaagggcca acagttcctg attaaccaca aaccgttcta ctctactggc 3060 
tttggtcgtc atgaagacgc ggacctacgt ggcaaaggat tcgataacgt gctgatggtg 3120 
cacgaccacg cattaatgga ctggattggg gccaactcct accgtacctc gcattaccct 3180 
tacgctgaag agatgctcga ctgggcagat gaacatggca tcgtggtgat tgatgaaact 3240 
gccgctgtcg gccttaacct ctctttaggc attggtttcg aagcgggcaa caagccgaaa 3300 
gaactgtaca gcgaagaggc agtcaacggg gaaactcagc aagcgcactt acaggcgatt 33 60 
aaagagctga tagcgcgtga caaaaaccac ccaagcgtgg tgatgtggag tattgccaac 342 0 
gaaccggaca cccgtccgca agtgcacggg aatatttcgc cactggcgga agcaacgcgt 348 0 
aaactcgacc cgacgcgtcc gatcacctgc gtcaatgtaa tgttctgcga cgctcacacc 3540 
gataccatca gcgatctctt tgatgtgctg tgcctgaacc gttattacgg atggtatgtc 3600 
caaagcggcg atttggaaac ggcagagaag gtactggaaa aagaacttct ggcctggcag 36 6 0 
gagaaactgc atcagccgat tatcatcacc gaatacggcg tggatacgtt agccgggccg 3720 
cactcaatgt acaccgacat. gtggagtgaa gagtatcagt gtgcatggct ggatatgtat 3780 
caccgcgtct ttgatcgcgt cagcgccgtc gtcggtgaac aggtatggaa tttcgccgac 3840 
tttgcgacct cgcaaggcat attgcgcgtt ggcggtaaca agaaagggat cttcactcgc 3900 
gaccgcaaac cgaagtcggc ggcttttccg ctgcaaaaac gctggactgg catgaacttc 3960 
ggtgaaaaac cgcagcaggg aggcaaacaa tgaatcaaca actctcctgg cgcaccatcg 4020 
tcggctacag cctcggcggg gaattgagct cgatcgttca aacatttggc aataaagttt 4080 
cttaagattg aatcctgttg ccggccttgc gatgattatc atataatttc tgttgaatta 4140 
cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat gggtctttat 4200 
gattagagcc ccgcaattat acacttaata cgcgatagaa aacaaaatat agcgcgcaaa 4260 
ctaggacaaa Ctatcgcgcg cggtgtcatc tatgttacta gatcgaatt 43 09 



<210> 5 
<211> 7599 
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<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de ia sequence 
PGKB5 

<400> 5 

ggaaacagct atgaccatga ttacgccaag 
aagctggagc tccaccgcgg tggcggccgc 
agccctcgtt ctccttggag ttcttcggga 
tcttatctgc tttgacgacg ccgactggac 
ttcgcaacct gtcagggatc tcgcgacggc 
gg^cgagact tcagccccac ccaaggaaac 
ttccgtaagc ggttcttcgc aaggtcgggg 
ctgagctccc gaggcgcgtt gacaagatgc 
caattgtctt cgtggactgc tttcgggacg 
aaacaaacat acctccacac aaatttatct 
atttattaaa cgctgcactt ggggtggtca 
aacccgtgaa atcaaaaaac tcgacggcct 
tggaattgat cagcgttggt gggaaagcgc 
aggcagtttt aacgatcagt tcgccgatgc 
gtatcagcgc gaagtcttta taccgaaagg 
cgatgcggtc actcattacg gcaaagtgtg 
gggcggctat acgccatttg aagccgatgt 
acgtatcacc gtttgcgtga acaacgaact 
gattaccgac gaaaacggca agaaaaagca 
cggaatccat cgcagcgtaa tgctctacac 
cgtggtgacg catgtcgcgc aagactgtaa 
caatggtgat gtcagcgttg aactgcgtga 
aggcactagc gggactttgc aagtggtgaa 
tctctatgaa ctgtgcgtca cagccaaaag 
cgtcggcatc cggtcagtgg cagtgaaggg 
ctactttact ggctttggtc gtcatgaaga 
cgtgctgatg gtgcacgacc acgcattaat 
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artificielle: ADN-T de 



ctcggaatta 


accctcacta 


aagggaacaa 


60 


tctagaggat 


ccccccacag 


acagctccgt 


120 


aatggatctt 


tcgattcccg 


atgatgtctc 


180 


atccgctata 


acgccgccat 


tgaccgtgat 


240 


tgccacagaa 


gacctgatcg 


cccgctcaaa 


300 


tcttctcccg 


gcggttctca 


tagagcgcgg 


3 60 


ttgcataccg 


aactcgcgaa 


acgtcggcga 


420 


cacgaaggga 


atggaagaca 


gccgatattg 


480 


taaggcgcaa 


gccatcatca 


ccgccgtcct 


540 


acctgaccac 


aagatatatc 


ctgtcacacg 


600 


gtcccttatg 


ttacgtcctg 


tagaaacccc 


660 


gtgggcattc 


agtctggatc 


gcgaaaactg 


720 


gttacaagaa 


agccgggcaa 


ttgctgtgcc 


780 


agatattcgt 


aattatgcgg 


gcaacgtctg 


840 


ttgggcaggc 


cagcgtatcg 


tgctgcgttt 


900 


ggtcaataat 


caggaagtga 


tggagcatca 


960 


cacgccgtat 


gttattgccg 


ggaaaagtgc 


1020 


gaactggcag 


actatcccgc 


cgggaatggt 


1080 


gtcttacttc 


catgatttct 


ttaactatgc 


1140 


cacgccgaac 


acctgggtgg 


acgatatcac 


12 0 0 


ccacgcgtct 


gttgactggc 


aggtggtggc 


1260 


tgcggatcaa 


caggtggttg 


caactggaca 


1320 


t ccgcacctc 


tggcaaccgg 


gtgaaggtta 


1380 


ccagacagag 


tgtgatatct 


acccgcttcg 
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ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc agcaatatca 3 78 0 
cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc acagtcgatg 3 84 0 
aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc gccatgggtc 3 900 
acgacgagat cctcgccgtc gggcatgcgc gccttgagcc tggcgaacag ttcggctggc 3960 
gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc ttccatccga 4020 
gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt agccggatca 408 0 
agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc aggagcaagg 414 0 
tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc ccttcccgct 4200 
tcagtgacaa cgtcgagcac agctgcgcaa ggaacgcccg tcgtggccag ccacgatagc 426 0 
cgcgctgcct cgtcctgcag ttcattcagg gcaccggaca ggtcggtctt gacaaaaaga 432 0 
accgggcgcc cctgcgctga cagccggaac acggcggcat cagagcagcc gattgtctgt 4380 
tgtgcccagt catagccgaa tagcctctcc acccaagcgg ccggagaacc tgcgtgcaat 4440 
ccatcttgtt caatccacat gatcatgggc cggatctttg attgagagtg aatatgagac 4500 
tctaattgga taccgagggg aatttatgga acgtcagtgg agcatttttg acaagaaata 4560 
tttgctagct gatagtgacc ttaggcgact tttgaacgcg caataatggt ttctgacgta 4620 
tgtgcttagc tcattaaact ccagaaaccc gcggctgagt ggctccttca atcgttgcgg 4680 
ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg tcataacgtg 4740 
actcccttaa ttctccgctc atgatcctgt ttcctgtgtg aaattgttat ccgctcacaa 4800 
ttccacacat tatacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga 4860 
gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt 4920 
gccagctgca ttaatgaatc ggaattgacg gatctccttt gccccggaga tcaccatgga 4980 
cgactttctc tatctctacg atctaggaag aaagttcgac ggagaaggtg acgataccat 504 0 
gttcaccacc gataatgaga agattagcct cttcaatttc agaaagaatg ctgacccaca 5100 
gatggttaga gaggcctacg cggcaggtct catcaagacg atctacccga gtaataatct 5160 
ccaggagatc aaataccttc ccaagaaggt taaagatgca gtcaaaagat tcaggactaa 5220 
ctgcatcaag aacacagaga aagatatatt tctcaagatc agaagtacta ttccagtatg 5280 
gacgatztcaa ggcttgcttc ataaaccaag gcaagtaata gagattggag tctctaagaa 5340 
agtagttcct actgaatcaa aggccatgga gtcaaaaatt cagatcgagg atctaacaga 54 0 0 
actcgccgtg aagactggcg aacagttcat acagagtctt ttacgactca atgacaagaa 54 6 0 
gaaaatcttc gtcaacatgg tggagcacga cactctcgtc tactccaaga atatcaaaga 5520 
tacagtctca gaagaccaaa gggctattga gacttttcaa caaagggtaa tatcgggaaa 5580 
cctcctcgga ttccattgcc cagctatctg tcacttcatc aaaaggacag tagaaaagga 5640 
aggtggcacc tacaaatgcc atcattgcga taaaggaaag gctatcgttc aagatgcctc 57 00 
tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga 5760 
cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat atctccadtg acgtaaggga 5820 
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tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca 5880 
tttggagagg acacgctgaa atcaccagtc tctctctaca aatcggatcc atgagcccag 5940 
aacgacgccc ggccgacatc cgccgtgcca ccgaggcgga catgccggcg gtctgcacca 6000 
tcgtcaacca ctacatcgag acaagcacgg tcaactticcg taccgagccg caggaaccgc 6060 
aggagtggac ggacgacctc gtccgtictgc gggagcgcta tccctggctc gtcgccgagg 6120 
tggacggcga ggtcgccggc atcgcctacg cgggcccctg gaaggcacgc aacgcctacg 6180 
actggacggc cgagtcgacc gtgtacgtct ccccccgcca ccagcggacg ggactgggct 6240 
ccacgctcta cacccacctg ctgaagtccc tggaggcaca gggcttcaag agcgtggtcg 63 00 
ctgtcatcgg gctgcccaac gacccgagcg tgcgcatgca cgaggcgctc ggatatgccc 63 6 0 
cccgcggcat gctgcgggcg gccggcrtca agcacgggaa ctggcatgac gtgggtttct 6420 
ggcagctgga cttcagcctg ccggtaccgc cccgtccggt cctgcccgtc accgagatct 6480 
gatctcacgc gtctaggatc cgatggatcc cccgatgagc taagctagct atatcatcaa 6540 
tttatgtatt acacataata tcgcacticag tctttcatct acggcaatgt accagctgat 6600 
ataatcagtt attgaaatat ttctgaattt aaactcgcat caataaattt atgtttttgc 6660 
ttggactata atacctgact tgttatttta tcaataaata tttaaactat atttctttca 6720 
agatgggaat taacatctac aaattgcctt ttcttatcga ccatgtacat caagcttatc 6780 
gataccgtcg gctattggta ataggacact gggattcgtc ttggacaact ttccttctca 6840 
tctaagcgta gacaaccctc aactggaaac gggccggact ccagggcgtg tgccaggtgc 6900 
ccacggaata gttttggcca gacccttgaa aatccgattc agtacaatcg attgccctca 6960 
tttttacgtt ggcatatatc ctgccaaaca gccaacaacg cgcgtgcggt gaataggaaa 702 0 
gcgtttgagt tgcttgctca tatcgtgacg gttgacagca caggttgacc gcttgatgat 7080 
tcgtacgagc cgccaaacat tggctgtcgt aatgatatac catgtcagaa cagcaatccg 7140 
atggggcgga aagcattatc ttaatgcaca cggaaatggc gcgtcggtgg gtggaataca 7200 
ccgacataga ggccgtaagt tctgcatggt catcgtcgga aaggtggcag caggcgcacg 7260 
gctgtggcct cttgctcttt cagcgtgaaa tgcgtgttga aagaataatc gaagagagcg 73 20 
tccgctcgac accctcaatt atgccgattt gatcgatgaa ctgatcgagc tctgaaatcg 73 80 
aaggggcttc gataatcgca atcaaatcaa aagtgccact cacagaatga agagcgataa 7440 
cggccgtgac cttcccaagg gaggccgtca cctgtgaaag cgccttcgta atggtgatca 7500 
gaatatgggc tcgaaccaag ctcgagacct cgaggggggg cccggtaccc aattcgccct 7560 
atagtgagtc gtattacaat tcactggccg tcgttttac 7599 
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